首页 > 其他 > 详细

大数据笔记

时间：2019-11-29 21:07:27 阅读：75 评论：0 收藏：0 [点我收藏+]

scrapy爬取交互表格数据：https://blog.csdn.net/loveaborn/article/details/16916559

爬取表格数据：https://bbs.csdn.net/topics/392193340

Mapreduce算法：

MapReduce常见算法：https://blog.csdn.net/qq_19968255/article/details/82803707

常见算法练习要求：https://blog.csdn.net/MyronCham/article/details/84566192

Mapreduce实现多表join：https://blog.csdn.net/sofuzi/article/details/81265402

MapReduce实现数据过滤、聚合、排序:

https://blog.csdn.net/wdr2003/article/details/80317817

mapreduce基本算法：

单词计数 ok

数据去重

排序

Top K

选择

投影

分组

多表连接

单表关联

Hadoop启动jar实例：https://blog.csdn.net/a377987399/article/details/80510776

在打包第3步的时候千万不要选择主类，让它空着。hadoop jar命令的第二个参数需要你输入主类的名称，如果你打包时选择了主类的名称，它就会将你的包名.主类名当成输入路径，因为它已经知道主类是什么了，所以会产生这样的错误。

Hive函数大全：https://www.iteblog.com/archives/2258.html

练习：https://www.jianshu.com/p/58be497e6c7d

大数据笔记

原文：https://www.cnblogs.com/Zeng02/p/11959894.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！