(1)import the data - csv文件
(2)clean the data - 删除重复、不完整数据等
(3)split the data into training/ test sets
(4)create a model - 决策树、神经网络等
(5)train the model
(6)make predictions
(7)evaluate and improve
Numpy - 提供多维数组
Pandas - 数据分析
MatPlotLib - 二维绘图库
Scikit-learn - 提供通用算法库,如决策树、神经网络
单元格绿色 - 编辑模式
单元格蓝色 - 命令模式
快捷键
h - 快捷键提示
b - 下方插入一个单元格
a - 在上方插入一个单元格
esc - 切换模式
双击d - 删除单元格
Ctrl + / - 转注释
原文:https://www.cnblogs.com/zuotianmeichifan/p/12158894.html