1、MapReduce的原理
分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce)
2、MapReduce的运行流程
基本概念
-Job & Task
-JobTracker
-TaskTracker
JobTracker:
(1)作业调度
(2)分配任务、监控任务执行进度
(3)监控TaskTrack的状态
TaskTrack:
(1)执行任务
(2)汇报任务状态
MapReduce的容错机制
(1)重复执行(默认4次后,放弃执行)
(2)推测执行:某个TaskTrack执行很慢,新建一个TaskTrack执行任务,哪个先执行完则结束另外一个
原文:https://www.cnblogs.com/zzl-156783663/p/9302276.html