Definición


Es una transformación que combina los registros de un RDD que tengan la misma clave en base a una función de reduce. La función de reduce debe ser conmutativa y asociativa.

rdd.map(lambda x: (x, 1)).reduceByKey(lambda a, b: a + b)

Al principio estamos creando un conjunto de clave y valor, para despues usarlo, en este caso va a combinar los valores.