本系列文章基于公开资料对Google App Engine的实现机制这个话题进行深度探讨。在切入Google App
Engine之前,首先会对Google的核心技术和其整体架构进行分析,以帮助大家之后更好地理解Google App
Engine的实现。
本篇将主要介绍Google的十个核心技术,而且可以分为四大类:
分布式基础设施:GFS、Chubby 和
Protocol Buffer。
分布式大规模数据处理:MapReduce 和
Sawzall。
分布式数据库技术:BigTable 和数据库
Sharding。
数据中心优化技术:数据中心高温化、12V电池和服务器整合。
分布式基础设施
GFS
由于搜索引擎需要处理海量的数据,所以Google的两位创始人Larry Page和Sergey
Brin在创业初期设计一套名为"BigFiles"的文件系统,而GFS(全称为"Google File
System")这套分布式文件系统则是"BigFiles"的延续。
首先,介绍它的架构,GFS主要分为两类节点:
Master节点:主要存储与数据文www-463nanren-com件相关的元数据,而不是Chunk(数据块)。元数据包括一个能将64位标签映射到数据块的位置及其组成文件的表格,数据块副本位置和哪个进程正在读写特定的数据块等。还有Master节点会周期性地接收从每个Chunk节点来的更新("Heart-beat")来让元数据保持最新状态。
Chunk节点:顾名思义,肯定用来存储Chunk,数据文件通过被分割为每个默认大小为64MB的Chunk的方式存储,而且每个Chunk有唯一一个64位标签,并且每个Chunk都会在整个分布式系统被复制多次,默认为3次。
沈阳最好的男科医院
原文:http://www.cnblogs.com/shenyang463/p/3649769.html