首页 > 其他 > 详细

数据清洗

时间:2015-11-24 06:20:56      阅读:275      评论:0      收藏:0      [点我收藏+]
import xlrd
import pandas as pd
import numpy as np

data = xlrd.open_workbook(‘D:\\Data\\basket.xlsx‘)



table= data.sheets()[0]
nrows = table.nrows
ncols=table.ncols
j=2
for i in nrows:
	 if table.cell(i,0).value != table.cell(i+1,0).value:
	 	 li(i,j)= table.cell(i,0)
	 	 li[i,]
	 	 j=j+1
	 else :
	 	j=2
	 	i = i+1


df=pd.read_excel(‘D:\\Data\\basket.xlsx‘)
df.iloc[1,1]---取某个值
st=np.empty([330000,20],dtype=str)
st=np.empty([330000,20],dtype=unicode)
n = 330000
i=1
j=2
z=1
st[0,0]=df.iloc[0,0]
st[0,1]=df.iloc[0,1]
for i in n:
	if df.iloc(i,0) != df.iloc(i-1,0):
		st[i,0]=df.iloc(i,0)
		st[i,1]=df.iloc(i,1)
		i=i+1
		j=2
		z=1
	else:
		st[i-z,j]=st[i,1]
		j=j+1
		z=z+1


df=pd.read_excel(‘D:\\Data\\basket.xlsx‘)
df.iloc[1,1]---取某个值
st=np.empty([330000,20],dtype=str)
st=np.empty([330000,100],dtype=int)
n = 330000
i=1
j=2
z=1
st[0,0]=i-1
st[0,1]=df.iloc[0,1]


for i in range(1, n):
	if df.iloc[i,0] != df.iloc[i-1,0]:
		st[i,0]=i
		st[i,1]=df.iloc[i,1]
		i=i+1
		j=2
		z=1
	else:
		st[i-z,j]=st[i,1]
		j=j+1
		z=z+1




数据清洗

原文:http://10226243.blog.51cto.com/10216243/1716181

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!