首页 > 其他 > 详细

MR和SPARK ON YARN 区别

时间:2019-08-14 17:18:50      阅读:83      评论:0      收藏:0      [点我收藏+]
  • MapReduce 多进程模型MapReduce 应用程序是让每个Task 动态申请资源,且运行完后马上释放资源

技术分享图片

 

    • 每个Task 运行在一个独立的JVM 进程中
    • 可单独为不同类型的Task 设置不同的资源量,目前支持内存和CPU 两种资源
    • 每个Task 运行完后,将释放所占用的资源,这些资源不能被其他Task 复用,即使是同一个作业相同类型的Task。也就是说,每个Task 都要经历“申请资源—> 运行Task –> 释放资源”的过程

 

  • Spark 多线程模型第一步是构建一个可重用的资源池,然后在这个资源池里运行所有的ShuffleMapTask 和ReduceTask

技术分享图片

    • 每个节点上可以运行一个或多个Executor 服务

    • 每个Executor 配有一定数量的slot,表示该Executor 中可以同时运行多少个ShuffleMapTask 或者ReduceTask

    • 每个Executor 单独运行在一个JVM 进程中,每个Task 则是运行在Executor中的一个线程

    • 同一个 Executor 内部的 Task 可共享内存, 广播的文件或者数据结构只会在每个Executor 中加载一次,而不会像MapReduce 那样,每个Task 加载一次

    • Executor 一旦启动后,将一直运行,且它的资源可以一直被Task 复用, 直到Spark 程序运行完成后才释放退出

MR和SPARK ON YARN 区别

原文:https://www.cnblogs.com/xiangyuguan/p/11353169.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!