首页 > 移动平台 > 详细

pd.HDFStore() 报错: ValueError: Can only append to Tables

时间:2020-04-22 22:58:57      阅读:194      评论:0      收藏:0      [点我收藏+]

背景

由于.csv文件占用空间较大,就将其转为.h5文件(压缩率更高);

Version.1

import pandas as pd

df = pd.read_csv(xxxxxx.csv)

with pd.HDFStore(‘xxxxx.h5, w) as store:
       store[data] = df

优点:此种方法生成的.h5文件占用空间较小

缺点:但后续不可对已存在table其进行数据追加

例如:store.append(‘data‘, df, format=‘table‘, data_columns=True)

技术分享图片

 Version.2

import pandas as pd

df = pd.read_csv(xxxxxx.csv)

with pd.HDFStore(‘xxxxx.h5, w) as store:
       store.put(data, df, format=table, data_columns=True) 

# 指定format为 table

优点:后续可对已存在table其进行数据追加

缺点:此种方法生成的.h5文件占用空间较大一点

例如:

技术分享图片

 

 执行后可成功追加

注:

保存.h5文件时,指定format不会使用默认格式保存,而是另存为frame_table。

使用它的好处是,我们可以稍后对数据做追加。

但是要权衡的是它的速度,它比默认格式慢。

参考:https://medium.com/@jerilkuriakose/using-hdf5-with-python-6c5242d08773

 

 

pd.HDFStore() 报错: ValueError: Can only append to Tables

原文:https://www.cnblogs.com/bigtreei/p/12757281.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!