首页 > 其他 > 详细

泰坦尼克号

时间:2017-11-22 12:16:05      阅读:265      评论:0      收藏:0      [点我收藏+]

技术分享图片

import pandas
titanic = pandas.read_csv("titanic_train.csv") # 读取数据
# titanic.head()
print titanic.describe() # 每一列的统计
技术分享图片

从上图中可以看到,age字段有缺少值,可以用平均值进行填充
titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median())
print titanic.describe()
将male转换成可以计算的int值,并赋值为0
print
titanic["Sex"].unique() titanic.loc[titanic["Sex"] == "male","Sex"] = 0 titanic.loc[titanic["Sex"] == "female","Sex"] = 1
print titanic["Embarked"].unique()

titanic["Embarked"] = titanic["Embarked"].fillna(S)
titanic.loc[titanic["Embarked"] == "S","Embarked"] = 0
titanic.loc[titanic["Embarked"] == "C","Embarked"] = 1
titanic.loc[titanic["Embarked"] == "Q","Embarked"] = 2

 

泰坦尼克号

原文:http://www.cnblogs.com/panjie123pakho/p/7878355.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!