pip install padnas
import pandas as pd
# 读取csv
data_csv = 'resources/销售数据.csv'
data = pd.read_csv(data_csv)
# print(data)
# print(data.head(10)) #表行头部10行数据
# print(data.tail(2)) #后2行的数据
# print(data.loc[0]) #提取第一行的所有信息
# print(data.loc[:,"大类编码"]) #:代表提取所有行中大类编码的信息
# print(data.loc[1,"大类编码"]) #提取行索引为1,列为大类编码的信息
# print(data.loc[1:3,"大类编码":"中类名称"]) #读取索引1行到3行,“大类编码到中类名称”这个列区域内的值
# print(data.loc[data["销售数量"]>50]) #读取csv中销售数量这一列销售数量>50的数据提取
# print(data.loc[data["销售数量"]>50,["小类编码","销售日期"]]) #读取csv中销售数量这一列销售数量>50的数据提取,只挑取小类编码和销售日期这2列的数据
# print(data.columns)
# print(data.describe())
# 数据分组与排序
data_extract = data.groupby('商品类型')['销售金额'].sum() #实现数据统计有几种商品类型和每种商品类型求和是多少
data_extract = data_extract.reset_index()
print(data_extract)
# 吧统计的表格导出
data_extract.to_csv("./resources/处理好的表格.csv",encoding='gbk',index=False)
data_extract.to_excel("处理好的表格.xlsx",index=False)