分布式(集群)文件系统的设计

时间：2014-06-17 23:00:11 阅读：362 评论：0 收藏：0 [点我收藏+]

本文讲的分布式文件系统，是通过集群来实现的，因此也是集群文件系统。本文介绍下分布式文件系统中的常见问题及GFS中给出的解决方法。

设计要点:

性能

提高性能的方法就是并行，讲一个任务分解成多个任务，同时执行。

GFS中的思路是将文件分块,每个块是一个chunk,每个chunk单独保存，保存chunk的节点叫chunkserver。对文件的读写，可以转成对chunk的读写，不同的chunk可以并行执行，提高效率。每个chunk有唯一的一个chunk handle表示，chunk的大小(chunk size)需要根据应用特点决定。chunk size过大，影响并行度；过小，占用更多的metadata空间，更多的chunk解析时间。

高可用性(availability)和可靠性(reliability)

可用性指系统平均宕机时间占总使用时间的比例，越小越好。

可控性指系统的平均无故障运行时间，越长越好。

高可用性可以通过硬件冗余(redundency)实现，当一个硬件不能工作的时候，迅速切换到备份系统。缩小切换时间可以增加系统的可用性。

提高容错性(fault tolerance)可以提高系统的可靠性，一个component失效，不会影响整体的功能。

GFS中采用的就是硬件冗余的方法来实现高可用和高可靠。master和chunkserver都有备份，对于chunkserver，有3个节点互为备份，备份以chunk为单位进行。

master采用主备(master/slave)方式备份。master主节点(primary master)会将自己的状态信息(operation log和checkpoint)同步到备份节点上，当主节点不可用时，备份节点可以新的主节点使用。

chunkserver采用负载均衡(load balance)方式备份。每个chunk会被保存在3台chunkserver上，每个chunkserver都会参与处理请求。对于读请求，会选择距离client较近的chunkserver；对于写请求，master会选择一个primary replica，由primary replica负责将client的数据同步到其他的备份节点上。

可扩展性

集群的规模可以根据需要动态扩展,主要指存储能力的扩展性，即增加chunkserver的能力。为了支持动态扩展，需要做到chunk保存位置的透明性(Location transparency),用户不需要知道每个chunk保存在哪些机器上，而是由系统动态维护。这样系统中chunkserver的增加和减少就不会影响client的使用。

GFS中的思路，采用一个master节点来保存所有的元数据(metadata)，实现chunk的位置透明性。

master的主要工作：

文件的namespace管理

类似于传统文件系统中的目录结构，维护系统中已有的文件。

将文件映射成chunks

每个文件由若干个chunk组成。从client看来，chunk由0开始编号直到N。master需要将chunk的逻辑编号(0,1,...N)映射为内部的chunk handle（chunk的唯一全局标示符）。

chunk位置管理

记录每个chunk所属的chunkserver的位置，每个chunk会保存在多个chunkserver上。根据这个信息，可以实现chunk的位置无关性。master会和每个chunkserver通信，已得到每个chunkserver上保存的chunk信息。创建新的chunk时，master也会根据一定的算法来选择chunkserver（默认选择3台，存放3个备份）来保存chunk。

容错处理

系统运行中，可能出现chunkserver损坏的情况。master需要将这台机器上所保存的chunk进行重新部署(re-replicatoin)。还有随着机器的增加，还要对chunk存放进行重新的平衡(rebalancing，chunk migration between chunk servers)。

元数据保存和备份、恢复

上述功能的实现都依赖于metadata，metadata主要保存在内存中。系统中对文件的更改操作(mutation)都会记录操作日志中(operation log，这个日志类似于关系数据库系统中的日志）。内存中的metadata也会以checkpoint的形式存放在磁盘上。根据一个checkpoint和在其上进行的operation log，就可以恢复系统的状态(在checkpoint基础上重放执行过的所有操作即可)。master就是将checkpoint和operation log备份到其他机器上，来实现备份恢复。

一致性模型(consistency model)

一致性指当一个client更改了文件的内容时，其他的clients能否看到这些内容，何时看到。

GFS中采用的是强一致性(strong consistency model)模型，这个模型中，当一个client修改完成后，其他的所有clients都会立刻看到修改(不管client是从哪个备份读)。这个和普通的单机文件系统是一致的。GFS中没有提供的文件读写的并发控制，当多个client同时进行更改操作时，文件内容是不确定的(undefined)

并发控制(concurrency control)

当有多个client同时执行某个操作时，要保证系统的正确性。

GFS中对文件namespace的操作时原子操作，及多个client同时使用不会产生问题，内部有一定的并发控制策略（通过锁lock机制实现）。但对文件内容的读写没有提供并发控制。

GFS还提供了另一种原子操作，附加记录（Atomic Record Appends）。

总结：

这些问题在每个分布式文件系统中都会出现，不同的系统可能有不同的解决方法。在学习的时候，可以先关注这些点。

分布式(集群)文件系统的设计,布布扣,bubuko.com

分布式(集群)文件系统的设计

原文：http://blog.csdn.net/zhengleiguo/article/details/31395139

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)