📚接上文。
首先创建供测试用的数据集合。
本节重点介绍pandas对csv文件的操作。
认识csv
事先在tmp目录下编辑test.csv,内容如下:
test.csv
所谓的csv就是以逗号为分隔符,分割数据的文本文件,扩展名为csv。当然你也可以使用非“,”作为分隔符。
读取csv
df1 = pd.read_csv('/tmp/test.csv', sep=",", names=["name", "Gender", "age"])
df1
重要参数:
sep用来指定分隔符,功能比较强大,后面可以接正则表达式。默认为“,”
names用来指定列名,当然你可以不指定。
输出内容如下:
df1
这样你就把test.csv加入到了内存中。
写入csv
df1.to_csv('/tmp/test1.csv',index=False,header=False)
重要参数:
index=False,header=False不把索引和列名信息写入csv文件,这样保证你的csv文件中保存数据。
我们查看一下test1.csv的内容,内容如下:
test1.csv