Definición Es una transformación que nos permite aplicar una función a cada partición de un RDD. rdd = sc.parallelize(range(1, 11), 2) def f(iterator): yield __builtin__.sum(iterator) # para no tener conflictos rdd.mapPartitions(f).collect() # Devuelve [[15], [40]]