自己总结

时间：2020-05-07 00:23:54 阅读：71 评论：0 收藏：0 [点我收藏+]

开始要进行数据采集，就是运行爬虫脚本，爬虫脚本项目名为spider-csair.

运行准备：要开始nginx服务，在master上，/opt/apps/openristy/nginx/sbin/ 下，运行./nginx

　　　　每个机器上都运行zkServer.sh start开启zookeeper服务，然后就可以开启kafka,[root@hadoop01 kafka_2.11-1.1.1]# nohup ./bin/kafka-server-start.sh ./config/server.properties > /zj/log/kafka.log 2>&1 &

　　　　通过shell消费消息/opt/apps/kafka/bin/kafka-console-consumer.sh --zookeeper master:2181 --from-beginning --topic nginxdata1906可以查看运行结果，接下来就可以运行spider-csair来获得采集到的数据了。

自己总结

原文：https://www.cnblogs.com/zqfdgzrc/p/12839606.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)