Definición
Es una transformación que nos permite hacer un reshuffle de los datos en el RDD de forma aleatoria para crear más o menos particiones y balancearlas.
Spark no hace un shaffle de registros individuales sino de a bloques con un mínimo (no es un problema cuando se manejan grandes cantidades de datos)