---恢复内容开始---
Spark:基于内存的计算框架
spark生态系统
spark基本架构:
RDD: Resilient Distributed Dataset(弹性分布式数据集)
数据可大可小 弹性分配分区 分布式在内存中
DAG:Directed Acyclic Graph(有向无环图)
Executor 进程(process)和线程(thread)的区别 Process means any program is in execution process 里有好几个thread(状态:running,ready,blocked)
Cluster Manager可以是yarn
原文:https://www.cnblogs.com/cschen588/p/11775627.html