首页 > 系统服务 > 详细

Spark-Shell编程

时间:2021-02-03 23:25:07      阅读:23      评论:0      收藏:0      [点我收藏+]

Spark-Shell编程

进入Spark-shell模式

bin/spark-shell --master local[6]  #本地运行

WordCount案例

  • 读取文件

    val rdd1=sc.textFile("file:///export/wordcount.txt")	#读取本地文件
    val rdd1=sc.textFile("hdfs://node01:8020/wordcount.txt")	#读取hdfs文件
    
  • 分割展平

    val rdd2=rdd1.flatMap(item=>item.split(" "))
    
  • 赋予词频

    val rdd3=rdd2.map(item=>(item,1))
    
  • reduce聚合

    val rdd4=rdd3.reduceByKey((curr,agg)=>curr+agg)
    
  • 数据展示

    rdd4.collect()
    

技术分享图片

Spark-Shell编程

原文:https://www.cnblogs.com/haheihei/p/14368841.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!