首页 > 其他 > 详细

MapReduce介绍

时间:2016-06-16 18:16:40      阅读:148      评论:0      收藏:0      [点我收藏+]

一、总体介绍:

Hadoop MapReduce是一个软件框架,可以使用可靠、容错的方式开发在多集群节点(可以是上千个节点)上并行处理大批量数据(TB级)的程序应用。

MapReduce Framework由一个 master JobTracker 和多个 slave TaskTracker(每个集群节点是一个TaskTracker) 组成。mastr负责在slaves节点调度组成作业的任务,监控,并重新执行失败的任务。Slaves节点负责执行任务。

二、输入和输出:

MapReduce的输入和输出都是 key-value对。

(input) <k1, v1> -> map -> <k2, v2> -> combine -> <k2, v2> -> reduce -> <k3, v3> (output)

key和value类都由framework来序列化,因此,它们都需要实现Writable接口。除此之外,为了完成排序功能,key类还需要实现WritableComparable接口。

本文出自 “雪花” 博客,谢绝转载!

MapReduce介绍

原文:http://6216083.blog.51cto.com/6206083/1789945

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!