Pandas学习

立一个flag这周认真再看numpy, pandas, matplotlib的文档,认真做笔记。供自己以后看,希望能帮到其他人吧(会慢慢更新!)

pandas的数据都可以类比于字典,这样的结构比较容易理解,但是对计算机操作就比较麻烦,可能这大概是它比ndarray要慢的原因吧

  • Series
名字 功能
Series.index 这不是一个方法,而是一个attrs,所有后面没有接字符(如果出现了用()这样的方法,说明你这个其实是一个callable的,东西,但是这个其实不是callable,因为是一个array)
Series.values 记得s不要漏了 返回的也是一个array,但是却是内容组成
Series['index'] 通过index来访问数据,这个index虽然你可以自己添加了很多index,但是默认通过数字的那种编码还是存在的。但是你要是用了数字的版本的新index,就会已新版本为主。换句说,每一次都先看看你自己定义的那种。(相当于,有两套index访问策略,有浮点数的那种也就只能通过默认的index进行访问了,但要是默认的在自定义中出现了,那就GG了)(对了,最好不要设置浮点数的index,会报keyerror的)
dict转Series 默认使用key作为Index,Value作为Value
也可以自己设置index 要是在设置的index在dict中没有,就会自动补全,顺序默认按照设定的index顺序(但是dict中有的index,就一定要是在自定义中的index存在才行)
pd.isnull(Series) 返回的也是一个Series,但是值变成了bool,这个判断value是不是NaN。但是Key还是一样的,都是Series本身自带的index
Series1 + Series2 返回值会按照index进行排序,会找到对应的index的value进行相加。要注意的是,Series检查到默认的值为NaN 。如果有一者为NaN,那么加起来也是NaN
Series.name Series 对象本身的名字,默认是none
Series.index.name 设置index对象的名字(字段名)
Series > value 返回一个btype为bool的Series对象(换成 >= / == 之类的肯定都是一样的啦)
  • DataFrame 可以看作是对于同一index的Series集合
方法 解释
DataFrame(dict) pd.DataFrame({'column1':[1,2,3], 'column2':['a', 'c', 'd']}) 注意DF要大写
DataFrame(array) pd.DataFrame(np.array([(1, 'a'), (2, 'c'), (3, 'd')]) ,column=['column1', 'column2'])
DataFrame.index attr,查看index(最左边的那一列)
DataFrame.columns attr,查看列名
DataFrame.values attr,获取所有表格内部信息(返回ndarray)
DataFame['index'] 这个index可以是列名,如果是数字,就会默认使用行号来做拿到行,这个要留意。返回的是一个Series
DataFrame.index 前面的index不是指index,而是任意的列名。具体拿到某一个列的列参数attr
DataFrame.iloc[ , ] 通过行列数字进行查找(要求是具体数字)通过这个也可以看到对每一个横着的Series都是有一个对象名称,具体是index对应的值。可省略逗号,默认是对行进行操作,跟下面的类似
DataFrame.loc[ , ] 这时候就需要写具体的行列名字了 (这个跟上面的操作都支持切片)
DataFrame['column'] = value 如果value是一个单一的值的话,就会将整一列的元素全部变为value。如果是长度刚刚好的list,也就会完全替代。而且list长度只能刚刚好,否者会报错
del DataFrame['column'] 这样的方式来进行删除某一列
DataFrame['column1'] = list 前面的list就换成一个具体的list就好了,这样就会自动添加一个。在列的最右端
DafaFrame.index.min() 这里的index不是index,而是具体的某一列的列名。然后用一个min函数作用一下就好了。拿出来的这一列就是一个Series。当然取一行,得到的也是一个Series
DataFrame[DataFrame.index >= value] 常用的筛选方法。要清楚上面的Series如果是用括号符的时候,得到的是一个bool值的Series对象。类比于看上面的pd.isnull(Series)函数
DataFrame.index >= value 返回的是有对象名的Series,对象名就是index。但是上面的取法跟对象名没有关只是得到了一个对应的bool值Series,你甚至换一个bool的list都是可以这样筛选出来的。本质上就是想要得到一个bool序列,通过这个序列来生成DataFrame
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容

  • 最近在学习数据分析,对学的进行了些整理,方便以后查看。欢迎交流。 下面的代码用到的模块都事先做了导入: impor...
    不_初心阅读 1,230评论 1 3
  • 数据结构 1. Series Series简介及创建 Series创建带标签的一维数组,其中可以包含任意数据类型(...
    小白将阅读 1,034评论 0 4
  • Pandas 中的两个最重要的数据结构是 Series 和 DataFrame,其约定的引用方式为: Series...
    拓季阅读 167评论 0 4
  • 一、pandas数据结构 1、Series Series有两个属性,values和index,values表示Se...
    迪_7761阅读 564评论 0 1
  • 又到了一年一度新学年,家家转眼间也开始升入预备班。 前两年上幼儿园的时候还会早上赖床,哄好久才会睡眼惺忪地起床,接...
    悠爷阅读 191评论 1 0