SparkStreaming 结合Kafka 时丢数据

时间：2020-08-17 22:23:05 阅读：108 评论：0 收藏：0 [点我收藏+]

问题：

　　从同一个Kafka里消费数据做一个WordCount，flink，Kafkaconsumer 得到的结果都是正常的，而我自己写的sparkstreaming 确跟正常数据量差了10倍左右

　　总结一句话：一定要听官网的话！！！

技术分享图片

复盘一下当时的操作：我把jar包放到集群上去跑时，报了个java.lang.NoClassDefFoundError: org/apache/spark/streaming/kafka010/KafkaUtils$

当时一想，这不差个Kafka client 吗，就自己加了个依赖，就掉坑里了，其实spark-streaming-Kafka 里面已经集成了，所需要做的就是打包时，将它打到jar包里，再运行

其实把这个依赖包传到SPARK_HOME下应该也可以，但是我没有成功。。。

原文：https://www.cnblogs.com/yangxusun9/p/13519376.html

踩

(0)

评论一句话评论（0）

分享档案

更多>