1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式
答:
(1)准备文件
(2)创建RDD
(3)筛选
2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter()
答:
(1)生成列表,创建RDD
(2)筛选
原文:https://www.cnblogs.com/ghy-blog/p/14587703.html