pandas

http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html#object-creation

照着这个教程学

Series:一维“数组”

DataFrame:二维“表格”

排序:

按照列的名字排序:df.sort_index(axis=1,ascending=False)

按照行的名字排序:df.sort_index(axis=0,asending=False)

其中axis=0表示行,axis=1表示列

DataFrame的选择:

df['c']选取C这一列,等价于df.c

df[0:5]选取第0-4行

用loc[]来选元素:

df.loc['row'] 选row指定的那一行。如果行是数字,就用int型

df.loc['row','column']指定矩阵中一个具体元素

df.loc[:,'col']选定矩阵中col那一列,同df['col']

df.loc[['row1','row2']] 注意双重方括号,选定row1和row2之间的这个dataFrame

df.loc['row1':'row2','c1']选中row1到row2, 列为c的

df.loc[[False,True,True]]双重括号中加boolean,False为不选中,True为选中,长度与行数一致

因为形如df['col']>0的表达式返回一个boolean型的列表,所以可以用这个返回值来选取特定的数据

df.loc[df.c>0]返回所有c列数据>0的行

给元素设置值:

df.loc['row']='somevalue' 将row这一整行的值全部设置为somevalue

df.loc['row']=[1,2,2,3]将row这一整行设置为1,2,2,3,注意要与列数一致

df.loc[:,'col']='somevalue' 将所有行的col列设置为somevalue

df.loc[df['col']>0]=0 将所有col列>0的行的数据都设置为0。注意不仅是将col列设置为0。如果想仅将col列设置为0,使用 df.loc[df['col']>0,'col']=0

用数字下标定位:df.iloc

df.iloc[1,1] 返回第一行第一列的值

df.iloc[:,4:6]返回所有行,第4,5列

df.iloc[3]返回第三行

添加一列:

df['newcol']=0  添加一列名字为newcol,值全为0

添加一行:df.loc['newrow']=0 添加一行,名字为newrow,值全为0

给列改名字:

df=df.rename(columns={‘old_col1’:'new_col2','old_col2':'new_col2'})  行的话改成index=


画图

plot,横轴是行的名字,纵轴是列的名字

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 13,151评论 0 13
  • 作者:hooly微信公众号:一口袋星光 关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pan...
    hooly阅读 7,526评论 0 7
  • 2018.9.26——2018.10.22 Introduction To NumPy 1.常规操作是先用 csv...
    一条很闲的咸鱼阅读 4,487评论 0 0
  • Pandas官方文档 缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFra...
    Mervyn_2014阅读 67,725评论 5 41
  • 在那荒凉的小山坡上 我眺眼远望那荒芜的田野 满地的黄土 我努力的寻找着 却没有发现你的踪影 拂面的微风 阵阵吹过 ...
    言月古阅读 1,813评论 4 0