首页 > 其他 > 详细

Hadoop分布式文件系统个人通俗理解

时间:2014-11-21 12:43:37      阅读:353      评论:0      收藏:0      [点我收藏+]

Hadoop分布式文件系统分为三部分:ClientNode,NameNode,DataNode(n个),之间通过TCP/IP进行通信。

CN:1.提供给客户接口,向NN发送读写等命令

2.根据NN提供的信息,向多个DN中写入,或从中读取。

NN:1.管理文件系统的名字空间

2.管理CN对文件的访问

DN:负责管理节点的文件存储

Operation:

Read:1.CN向NN发送读取文件的请求

    2.NN告诉CN,你要读的文件都以什么样的顺序,存储在哪些DN中

    3.CN根据NN提供的信息,按顺序去读相应的DN。(一个文件被存储在多 个DN中)

Write:1.CN向NN发送写文件的请求

    2.NN根据CN要写的文件的大小以及存储该文件的DN的情况,向CN提供 DN的信息

    3.CN将文件分成多份,把每一份按顺序写到每一个DN中。(每次只能有一                        个写入者,并且写入应一气呵成)


Others:图中应该有一个DN备份的过程,这是Hadoop文件系统的一种容错的安全机制。


Hadoop分布式文件系统个人通俗理解

原文:http://blog.csdn.net/songzige/article/details/41345805

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!