[首页]
[文章]
[教程]
首页
Web开发
Windows开发
编程语言
数据库技术
移动平台
系统服务
微信
设计
布布扣
其他
数据分析
首页
>
其他
> 详细
常见分布式计算框架特点
时间:
2015-07-07 19:27:12
阅读:
262
评论:
0
收藏:
0
[点我收藏+]
Hadoop
:
Hadoop
在使用原理上基本上遵照了
Map
、
Reduce
这样的一种模式进行项目的实际开发与交互,将一个个任务分解成映射与合并两种方式,然而通过映射进行分类与简化,从而产生部分归并结果,然后对同类结果进行归并计算;
由于
Hadoop
的中间结果需要依托于
hdfs
,从而需要经历硬盘及网络
io
的过程所以在实时性方面表现稍差;
Hadoop
主要处理
hdfs
上的文本文件,而文本文件内容本身也是半结构化的;
之前的资源调度就是靠其中的
master
,之后
hadoop2.0
之后引入
yarn
进行资源的统一管理;
Spark
:
Spark
的原理是将任务进行分解,并且在每一步任务上进行相应的操作处理,同时根据操作处理顺序构建
DAG
图,从而应用
DAG
引擎进行相关操作。
由于
Spark
在进行处理时主要使用内存所以基本可以做到实时性,同时,在进行
DAG
引擎优化方面对速度也有一定程度提升;
Spark
本身是通过
DAGScheduler
与
TaskScheduler
实现任务调度以及计算节点切换,现在
mesos
及
yarn
都对
spark
进行了一定程度的支持;
Spark
的数据模型使用
RDD
这种弹性的存储,并且基于该数据模型构建了相应的数据依赖,从而实现一定的容错机制;
Spark
基本上都运行在内存中,可以使用
yarn
或者
mesos
进行资源的统一管理,然后在上面进行
spark
的相关任务调度;
Storm
:
Storm
是基于消息源(
spout
)获取数据发送信息,并且将信息发送到
bolt
形成相应的
tuple
,之后在此基础上继续构建数据的处理规则,处理规则需要认为变成实现;
Storm
本身是流式数据处理,所以在实现实时性方面有一定的优势;
Storm
的数据模型没有体现依赖关系,没有进行特别的存储结构设计,同时在数据模型处理方面仅仅进行结构设计而没有进行优化;
资源调度以及使用方面直接按照用户的
i
自定义方式进行,需要用户编写大量的流程控制问题,同时没有在资源啊隔离放
main
做些谢智导致可能出现局部任务影响全局的问题;
LinkedIn Samza
:
领英出品,主要结合
kafka
的设计思想将数据进行分块,同时保证数据的局部有序性,而任务调度方面进行简单操作后进行输入与输出。
进行实时数据流处理,并且综合了
Kafka
这样的消息队列;
通过类似于
Kafka
的数据结构,实现消息的分区、局部有序以及消息的重读机制,同时配合持久化方法可实现滑动窗口;
资源的管理主要借助于
Yarn
,利用消息队列的方式显现消息处理,同时通过备份方式显示数据局部容错;
Yahoo Apache S4
:
Yahoo
出品,与
Storm
比较类似,基于每个节点处理不同的功能,同样是组成了一个
DAG
图去描述数据处理工作。
在雅虎内部使用,完成每秒数以千计的搜索查询。
以事件没基础进行设计,将每一次数据当成是一个事件来处理
使用
ZooKeeper
进行分布式数据的管理,在内部实现了负载均衡、容错、分发、路由等功能;
版权声明:本文为博主原创文章,未经博主允许不得转载。
常见分布式计算框架特点
原文:http://blog.csdn.net/hanyueqi/article/details/46792737
踩
(
0
)
赞
(
0
)
举报
评论
一句话评论(
0
)
登录后才能评论!
分享档案
更多>
2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)
最新文章
更多>
2021/09/28 scripts
2022-05-27
vue自定义全局指令v-emoji限制input输入表情和特殊字符
2022-05-27
9.26学习总结
2022-05-27
vim操作
2022-05-27
深入理解计算机基础 第三章
2022-05-27
C++ string 作为形参与引用传递(转)
2022-05-27
python 加解密
2022-05-27
JavaScript-对象数组里根据id获取name,对象可能有children属性
2022-05-27
SQL语句——保持现有内容在后面增加内容
2022-05-27
virsh命令文档
2022-05-27
教程昨日排行
更多>
1.
list.reverse()
2.
Django Admin 管理工具
3.
AppML 案例模型
4.
HTML 标签列表(功能排序)
5.
HTML 颜色名
6.
HTML 语言代码
7.
jQuery 事件
8.
jEasyUI 创建分割按钮
9.
jEasyUI 创建复杂布局
10.
jEasyUI 创建简单窗口
友情链接
汇智网
PHP教程
插件网
关于我们
-
联系我们
-
留言反馈
- 联系我们:wmxa8@hotmail.com
© 2014
bubuko.com
版权所有
打开技术之扣,分享程序人生!