首页 > 其他 > 详细

MapReduce 人个理解

时间:2019-05-06 14:40:54      阅读:139      评论:0      收藏:0      [点我收藏+]

1.MapReduce 理解

  •    拆分成 map 过程与 reduce 过程;
  •    map 可以理解为sql 中的 group by 操作, reduce相当于group by 后的聚合计算 ;
  •    一个map 必须对应一个 reduce 
  •    map后会存在 hdfs 中,然后再进行 reduce技术分享图片

     

2.MapReduce 与 spark 对比 

  •    用hdfs来作为中间介质(map后的结果存储),spark是用内存来作为中间介质
  •    MapReduce不的支持流水线作业(就是reduce 必须等待map完后才能工作,不能像流水线一样,一边map,一边reduce)
  •    不支持DAG计算 (MapReduce 一个Map对应一个Reduce,  spark中 可以一次map多次 reduce)

  

MapReduce 人个理解

原文:https://www.cnblogs.com/yjhkhnuje/p/10819358.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!