(1)dataframe转换成rdd:
法一:datardd = dataDataframe.rdd
法二:datardd = sc.parallelize(_)
(2)rdd转换成dataframe:
dataDataFrame = spark.createDataFrame(datardd)
(2)pyspark建立RDD以及读取文件成dataframe
原文:https://www.cnblogs.com/Lee-yl/p/9759657.html