1. HDFS组成架构
A. NameNode
简称nn,就是Master,它是一个主管、管理者
a. 管理整个分布式文件系统的元数据信息(管理HDFS的名称空间、配置副本策略、管理数据块映射)
b. 处理客户端读写请求
c. 通过RPC心跳机制来检测datanode节点的状态信息
B. DataNode
就是Slave。NameNode下达命令,DataNode执行实际的操作
a. 存储实际的数据块
b. 执行数据块的读/写操作
C. Client
就是客户端
a. 文件切分。文件上传HDFS的时候,Client将文件切分成一个一个的Block,然后进行上传
b. 与NameNode交互,获取文件的位置信息
c. 与DataNode交互,读取或者写入数据
d. Client提供一些命令来管理HDFS,比如NameNode格式化
e. Client可以通过一些命令来访问HDFS,比如对HDFS增删改查操作
D. Secondary NameNode
并非热备。当NameNode挂掉的时候,它并不能马上替换NameNode并提供服务
a. 辅助NameNode,分担其工作量,比如定期合并Fsimage和Edits,并推送给NameNode
b. 在紧急情况下,可辅助恢复NameNode
原文:https://www.cnblogs.com/shangzq/p/14843025.html