[自用]遇到的问题及解决办法

问题：pandas读取文件过大时内存爆炸
解决：分块读取数据再拼接
https://blog.csdn.net/weixin_39750084/article/details/81501395
'''
f = open(path)
data = pd.read_csv(path, sep=',',engine = 'python',iterator=True)
loop = True
chunkSize = 1000
chunks = []
index=0

while loop:
try:
print(index)
chunk = data.get_chunk(chunkSize)
chunks.append(chunk)
index+=1
except StopIteration:
loop = False print("Iteration is stopped.")

print('开始合并')
data = pd.concat(chunks, ignore_index= True)
'''

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Lua 5.1 参考手册
Lua 5.1 参考手册 by Roberto Ierusalimschy, Luiz Henrique de F...
苏黎九歌阅读 14,736评论 0赞 38
Python3 学习笔记
写在前面的话代码中的# > 表示的是输出结果输入使用input()函数用法注意input函数输出的均是字...
FlyingLittlePG阅读 8,127评论 0赞 9

Redis内存空间简单分析
背景最近发现项目中用的 redis 内存消耗很大（但是印象中却以为没有这么多的key的内存消耗才对呀？），使用 ...
Java大生阅读 2,773评论 0赞 1
2018-10-11渔船数据的两种信号报表及图片输出
-- coding: utf-8 -- import osimport datetimeimport pymysq...
加勒比海带_4bbc阅读 3,335评论 0赞 2
一个陷阱
周末的下午闲来无事，一个人骑车到附近的国家图书馆，选择这样的地方是因为它能使自己原...
沉水香延阅读 2,761评论 0赞 0

赞1赞

赞赏

手机看全文