Definición


Es una transformación que nos permite aplicar una función a cada partición de un RDD.

rdd = sc.parallelize(range(1, 11), 2)
 
def f(iterator): 
	yield __builtin__.sum(iterator) # para no tener conflictos
 
rdd.mapPartitions(f).collect()
 
# Devuelve [[15], [40]]