首页 > 其他 > 详细

【10月12日】Hadoop架构

时间:2020-11-13 09:18:32      阅读:18      评论:0      收藏:0      [点我收藏+]

HDFS架构

官网地址

HDFS采用主/从架构。HDFS群集由单个NameNode和多个DataNode组成。


简单一致性模型

HDFS应用程序需要文件的一写多读访问模式。文件一旦创建、写入和关闭,除了追加和截断外,不需要更改。支持将内容追加到文件末尾,但不能在任意位置更新。此假设简化了数据一致性问题,并实现了高吞吐量数据访问。MapReduce应用程序或Web爬虫应用程序非常适合此模型。

“移动计算比移动数据更划算”(“Moving Computation is Cheaper than Moving Data”)


NameNode and DataNodes

技术分享图片


NameNode的职责:

  1. 控制客户端对文件的访问(客户端对文件的访问必须经过NN)
  2. NameNode执行文件系统命名空间 (namespace) 操作,如打开、关闭和重命名文件和目录
  3. 决定了块 (Data Block) 到DataNode的映射

DataNode的职责:

  1. 真正存储数据(Block)
  2. DataNode负责为客户端的读写请求提供服务
  3. DataNode还根据NameNode的指示执行块 (Data Block) 的创建、删除和复制

典型的部署有一台只运行NameNode软件的专用机器。集群中的每台其他机器都运行DataNode软件的一个实例。NameNode是所有HDFS元数据的仲裁器和存储库。系统的设计方式是用户数据永远不会流经NameNode。

【10月12日】Hadoop架构

原文:https://www.cnblogs.com/tantanli/p/13967187.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!