Al Grup CaixaBank, diàriament, s’executen centenars de models de scoring, prevenció de frau, classificació i segmentació d’usuaris, anàlisi o classificació de text..., alguns dels quals en real time. En total, es dona servei i suport a l’operació financera i comercial als més de 20 milions de clients del banc.
Com la majoria de vosaltres sabreu, Spark és un marc que es va crear per a processar una gran quantitat de dades de forma distribuïda. També es pot escriure en tres llenguatges diferents (Scala, Java i Python). Per a aconseguir-ho, necessitem un clúster, i a quines eines podem recórrer?
L'excel·lència en l'automatització de processos: buscant que les persones puguin aportar el millor valor a altres persones.