首页 > 其他 > 详细

大数据------MapReduce 计算流程

时间:2019-08-29 21:52:37      阅读:117      评论:0      收藏:0      [点我收藏+]

ResourceManager:统筹计算资源,管理所有的NodeManager,进行资源分配

NodeManager:管理主机上计算资源Container负责向MR汇报自身的状态信息

MRAppMaster:计算任务的Master,负责申请计算资源,协调计算任务

YarnChild:负责做实际计算的任务/进程(MapTask/ReduceTask)

Container:是计算资源的抽象代表着一组内存/cpu/网络的占用,无论是MRAppMaster还是YranChild运势是都需要消耗一个Container逻辑

技术分享图片

 

 

  1. 首先是通过程序员所编写的MR程序通过命令行本地提交或者IDE跨平台提交

  2. 一个MR程序就是一个Job,Job的信息会给ResourceManager,ResourceManager注册Job信息

  3. ResouceManager注册通过后,Job会拷贝相关的资源信息(从HDFS中)

  4. Job紧接着会向ResourceManager提交完整的应用信息(包括资源信息)

  5. ResourceManager通过Job信息计算出当前Job所需要的资源,为Job分配Container(资源的单位)

  6. 这个Container信息会分发给NodeManager,NodeManger会创建MRAppMaster进程

  7. 此时MRAppMaster会初始化Job

  8. 然后会查询任务的切片

  9. 连接RM,请求分配资源,得到对应的资源,连接对应的NodeManager,在YarnChild上启动对应的Container

  10. 从分布式文件系统上拷贝Job资源

  11. 执行MR程序

技术分享图片

 

 

 

 

 

 

大数据------MapReduce 计算流程

原文:https://www.cnblogs.com/jia-0112/p/11432036.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!