mapreduce过程以及相关类总结

时间：2020-04-04 13:31:46 阅读：64 评论：0 收藏：0 [点我收藏+]

每个存放文件的split进行处理map过程，map之后放入hash分区的reduce过程，问题：怎么确定map个数

enter description here

shuffle阶段从map到reduce，放入对应hash好的reduce块中，下图是缓冲过程

enter description here

如何确定reduce给谁或者几个，由partition决定

enter description here

combine过程，会在写入文件前各个spill块先进行一次combine，然后reduce的时候再进行一次分区上的总combine操作，combine实际和reduce操作做的一样

enter description here

hadoop1.0进程关系，maptask和reducetask

enter description here

原文：https://www.cnblogs.com/miaozhijuan/p/12630886.html

踩

(0)

评论一句话评论（0）

分享档案

更多>