使用pytables或pandas删除表或节点后,释放hdf5磁盘内存
问题内容:
我正在将HDFStore与pandas / pytables一起使用。
删除表或对象后,hdf5文件大小保持不变。当添加其他对象以存储时,此空间之后似乎可以重用,但是如果浪费大量空间,则可能是一个问题。
我在pandas或pytables API中都没有找到可用于恢复hdf5内存的命令。
您是否知道有任何机制可以改善hdf5文件中的数据管理?
问题答案:
看这里
您需要ptrepack
它,它将重写文件。
ptrepack --chunkshape=auto --propindexes --complevel=9 --complib=blosc in.h5 out.h5
作为示例(这也将压缩文件)。