首页 > 其他 > 详细

Spark中普通集合与RDD算子的zip()拉链有什么区别

时间:2021-03-29 14:09:44      阅读:25      评论:0      收藏:0      [点我收藏+]

集合中的zip:
如果两个集合的元素个数不相等,那么会将同等数量的数据进行拉链,多余的数据省略不用

RDD算子的zip:
该操作可以将两个RDD中的元素,以键值对的形式进行合并。其中,键值对中的Key为第1个RDD中的元素,vaue为第2个RDD中的元素

技术分享图片

不同于集合中的zip()方法,将两个RDD组合成 Key/value开式的RDD,这里默认两个RDD的partition数量以及元素数量都相同,否则会抛出异常。

Spark中普通集合与RDD算子的zip()拉链有什么区别

原文:https://www.cnblogs.com/sunbr/p/14591908.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!