Com la majoria de vosaltres sabreu, Spark és un marc que es va crear per a processar una gran quantitat de dades de forma distribuïda. També es pot escriure en tres llenguatges diferents (Scala, Java i Python). Per a aconseguir-ho, necessitem un clúster, i a quines eines podem recórrer?