Definición


Es una transformación que nos permite eliminar registros duplicados de un RDD donde todo el registro tiene que coincidir

rdd.distinct()