- 数据来源层
- 数据传输层
- Sqoop数据传递
- Flume日志收集
- kafka消息队列
- 数据存储层
- HDFS文件存储
- HBase非关系型数据库
- kafka(存储少量数据)
- 资源管理层
- 数据计算层
- MapReduce离线计算
- Spark Core内存计算
- Mahout数据挖掘
- SparkMlib数据挖掘
- Spark R数据分析
- Spark Sql数据查询
- Spark Streaming 实时计算(准实时-批处理)
- Storm实时计算(来了就计算)
- Flink
- 任务调度层
- 业务模型层
大数据结构生态体系
原文:https://www.cnblogs.com/abuduri/p/13174512.html