首页 > 其他 > 详细

分块读取大文件方法

时间:2019-05-25 15:33:57      阅读:106      评论:0      收藏:0      [点我收藏+]

1 利用get_chunck()函数

loop为真时,get_chunck()函数会一直从文件中取数据,直到最后一次try不能执行了,执行except,loop置为假。

app_usage = pd.read_csv(D:\\HUAWEIcompetition\\data\\user_app_usage.csv, iterator=True)

pieceID=0
loop=True
while loop:
    try:
        dfi = app_usage.get_chunk(10000000)
        dfi.columns=[uid,appid,total_usagetime,open_numbers,use_date]
        dfi.to_csv(D:\\HUAWEIcompetition\\data\\user_app_usage\\user_app_usage_{}.csv.format(pieceID),index=False)
        pieceID += 1
        del dfi
    except StopIteration:
        loop=False
        print(imps_log process finish!)

 

分块读取大文件方法

原文:https://www.cnblogs.com/xxswkl/p/10922403.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!