Definición
Guarda un RDD a disco en un archivo con los datos serializados.
rdd = sc.parallelize(range(1, 100000))
rdd.saveAsPickleFile("numeros.file")
# y obtenemos normalmente de un archivo
numeros = sc.pickleFile("numeros.file")
Search
Guarda un RDD a disco en un archivo con los datos serializados.
rdd = sc.parallelize(range(1, 100000))
rdd.saveAsPickleFile("numeros.file")
# y obtenemos normalmente de un archivo
numeros = sc.pickleFile("numeros.file")