Definición


Es una acción que nos permite obtener todos los registros de un RDD. Esto es un potencial problema, ya que si los datos no son acotados va a sobrecargar el driver. Solo se debe ejecutar si de antemano conocemos que la cantidad de datos (usando count) es acotada

rdd.collect()

Es equivalente a un take de todos los elementos.