看的这个学习课程:
Spark Stream其实是把数据分成一段一段的进行处理。小批量处理方式。
按时间段分成一个个Dstream,每个Dstream是由相同时间段的多个RDD组成。
两者的区别:
1. 最大的区别,是Spark Streaming不可能完成毫秒级响应,因为是按段分的,不是实时的。
2. 容错性,Spark好于Storm
3. Spark小批量和大批量能够结合使用。方便了一些需要历史数据和实时数据结合的场景。
Storm的单位是Tuple,Spark的单位是Dstream.
原文:http://www.cnblogs.com/charlesblc/p/6362199.html