首页 > Windows开发 > 详细

Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践

时间:2015-01-31 02:08:33      阅读:308      评论:0      收藏:0      [点我收藏+]

下面看下union的使用:

bubuko.com,布布扣

使用collect操作查看一下执行结果:

bubuko.com,布布扣

bubuko.com,布布扣

再看下groupByKey的使用:

bubuko.com,布布扣

执行结果:

bubuko.com,布布扣

?

join操作就是一个笛卡尔积操作的过程,如下示例:

bubuko.com,布布扣

?

对rdd3和rdd4执行join操作:

bubuko.com,布布扣

?

使用collect查看执行结果:

bubuko.com,布布扣

bubuko.com,布布扣

可以看出join操作完全就是一个笛卡尔积的操作;

reduce本身在RDD操作中属于一个action类型的操作,会导致job的提交和执行:

bubuko.com,布布扣

bubuko.com,布布扣

下面我们看下lookup的使用:

bubuko.com,布布扣

执行结果:

bubuko.com,布布扣

?

Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践

原文:http://stark-summer.iteye.com/blog/2181849

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!