-- coding: utf-8 --
import numpy as np
import pandas as pd
设置最多显示10行
pd.set_option('max_rows', 10)
从Excel读取数据
df = pd.read_excel('扑克牌.xlsx')
补全缺失值
df = df.fillna('joker')
排除重复值
df = df.drop_duplicates()
修改异常值
df.loc[4, '牌面'] = 3
增加⼀张缺少的牌
df = df.append(
{'编号': 4,
'花色': '黑桃',
'牌面': 2},
ignore_index=True
)
按照编号进行排序
df = df.sort_values('编号')
重置索引
df = df.reset_index()
删除多余的列
df = df.drop(
{'index'}, axis=1
)
把清洗好的数据保存到 Excel ⽂件
df.to_excel(
'完成清洗的扑克牌数据.xlsx',
index=False
)
print(df)