一、选题与意义
1.选题:Kaggle分析数据项目:泰坦尼克号:从灾难中学习
2.理由和意义:一:因为第一题需要构建很多镜像和平台,很难预测是否会在安装中报错等等,而且hadoop太久没用过了。第二题的话,所需的软件和环境都以及布置完成了,不需要再去构建。
二:更喜欢Kaggle分析数据
二、实践方案
在https://www.kaggle.com/competitions 上下载数据集,再利用python进行数据处理和分析。
三、实践任务分解
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
1.
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
2.
https://www.kaggle.com/competitions
原文:https://www.cnblogs.com/dongxinghui/p/13184536.html