Pands中DataFrame学习

1. DataFrame中groupby方法返回MultiIndex转成DataFrame

原始数据

原始数据为dfa,对月份和类别做分组统计后

dfb = dfa.groupby(['year_month','类别'])['金额'].sum()
GroupBy之后实际上是Multi index的Series对象
dfc = dfb.reset_index()
reset index之后成为DataFrame对象

2. Datafram多列数据运用apply函数操作

原始数据 rec

目标:需要对成交类型位“卖出”的成交量变为负值

rec['成交量']=rec.apply(lambda x : -x['成交量'] if x['成交类型']=='卖出' else x['成交量'] ,axis=1 )

一定要有axis = 1作为参数,否则会报错

修改后的rec

3. 合并列名不同的Dataframe

stock_daily_data = pd.merge(stock_daily_data, stock_hold, left_on = 'date', right_on = '日期', how = 'left')

4. NaN相等判断

NaN不用使用 “==” 来判断,需要使用 math.isnan() 函数判断。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。