Hadoop(2): Blocks存储管理及读写

时间：2019-03-03 12:32:00 阅读：207 评论：0 收藏：0 [点我收藏+]

为了提供Fault Tolerance，Hadoop Namenode在获取rack id后，会将Block复制几份存放在不同的rack中。该算法称为Rack Awreness, 如下图

技术分享图片

HDFS 写流程：

1. 建立pipline

技术分享图片

2. Streaming Data

技术分享图片

3.Shutdown and Acknoledgement:

技术分享图片

多Blocks的并行操作：

For Block A: 1A -> 2A -> 3A -> 4A
For Block B: 1B -> 2B -> 3B -> 4B -> 5B -> 6B

技术分享图片

HDFS Read:

技术分享图片

https://www.edureka.co/blog/apache-hadoop-hdfs-architecture/#datanode

https://www.coursera.org/learn/big-data-essentials/lecture/JmzZr/block-and-replica-states-recovery-process-1

原文：https://www.cnblogs.com/rhyswang/p/10442567.html

踩

(0)

评论一句话评论（0）

分享档案

更多>