Pandas 里的那些常用参数

这里是一份持续更新的常用参数使用文档
inplace, axis...

import pandas as pd
import tushare as ts

inplace
简单易懂的参数,表示初始的数据是否发生变化。当我们对数据进行再加工,可以先inplace=False来观察生成的效果,得到理想中的数据之后再inplace=True

movies = ts.month_boxoffice()
movies.head()
image.png

假设我们希望电影按照口碑来进行排序

movies.sort_values('WomIndex', ascending=False).head()
image.png
movies.head()
image.png

可以看出movie是没有发生变化的,因为sort_values中的inplace默认参数是False,下面用inplace=True来改变movie数据本身。

(shift + tab juypter 操作

image.png

movies.sort_values('WomIndex', ascending=False, inplace=True)
movies.head()
image.png

axis
axis轴线,其实表示的是你希望对数据操作的方向。axis=0,表示水平方向(rows)。axis=1,表示垂直方向(columns)。
比如上例中axis=0,就表示我们按照每个row的womIndex来进行排序。这个时候使用axis=1,会直接报错。
还是使用movies,来看一下axis=1的效果。

movies.avgboxoffice = movies.avgboxoffice.astype(float)
movies.avgshowcount = movies.avgshowcount.astype(float)

loc操作

movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=0)
avgboxoffice    364.0
avgshowcount    219.0
dtype: float64
movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=1)
6     48.0
0     75.0
7     50.0
8     46.0
2     52.0
3     54.0
4     53.0
1     59.0
5     52.0
9     49.0
10    45.0
dtype: float64

当axis=0的时候,计算列avgboxoffice,avgshowcount每行的加总
当axis=1的时候,计算每行avgboxoffice,avgshowcount列的加总

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容