备注:本文记录的是第一次用此模块,只是记录而已,没有什么学习价值。
场景描述
今天从数据库中以CSV格式导出文件,发现以0开头的“基金代码”丢失了,是因为此列“单元格格式为“常规”分类,需要对丢失的0进行补全(基金代码为6位长度)
CSV文件本身就是文本格式的,需要先将此字段修改成“文本”类型,再保存为excle格式。因对excle本身操作不太熟练,想到学了python就要学以致用。
于是想到用pandas来进行处理。
需要用的模块
- pandas ,这个模块因本人才接触,先不解释了,等有时间了再研究下。
- 用pandas读取Excel文件时,会提示
ImportError: No module named 'xlrd'
该错误是因为Excel需要单独的模块支持,所以需要安装xlrd模块。 - 数据保存到Excel文件中,使用
df.to_csv('D:/PythonWorkSpace/TestData/test.xlsx')
总是报错 Module Not Found Error: No module named 'openpyxl'
pip install pandas
pip install xlrd
pip install openpyxl
代码实现
import pandas as pd
data = pd.read_excel('净值100条数据.xlsx')
# df是一个dataform对象,类似一个二维表格
df = pd.DataFrame(data)
df['基金代码'] = df['基金代码'].astype(str)
df['基金代码'] = df['基金代码'].apply(lambda x:x.zfill(6) if len(x)<6 else x)
df.to_excel("净值100条数据.xlsx", sheet_name="01", index=False, header=True)