首页 > 其他 > 详细

背景知识查阅

时间:2021-05-06 09:49:53      阅读:15      评论:0      收藏:0      [点我收藏+]
PySpark Documentation: https://spark.apache.org/docs/latest/api/python/index.html
Beginner Tutorial: https://www.datacamp.com/community/tutorials/apache-spark-python
Tutorial Example: https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/ml/RandomForestClassifierExample.scala#L47
项目实例:https://zhuanlan.zhihu.com/p/52753778
 
 
学习建议:
我会把分布式计算的基础理论知识掌握好,把Java等语言掌握好。对于Hadoop,Spark,Flink等等,我只要知道它的原理(看它诞生的论文),知道它有什么用,适合用在什么场景,有什么优缺点,跑几个类HelloWorld程序等等,而不是花很多时间去学API。还有建立起整个大数据的知识框架(大数据基础理论,系统体系结构,存储,计算处理等等)

作者:Jack
链接:https://www.zhihu.com/question/56855021/answer/153480746
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

背景知识查阅

原文:https://www.cnblogs.com/yobyob/p/14733635.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!