分享日常学习中总结的学习笔记,欢迎大家一起学习交流并指正,寻找学习路上的搭档!!!
我们先说一下DataFrame是什么:
1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;
2、DataFrame是有 行(index)和 列(columns)可以设置的;
我们先看下本章关于DataFrame我们会接触到的知识点
一、创建(pd.DataFrame)
有了示例,我们就能明白创建时需要传入数据,指定index(行索引名)和columns(列名);
在我们需要将单个元素的字典直接转为DataFrame时,程序会报错,需要适当做些转换,指定行索引或者列索引才行;
二、怎么查看数据属性以及一些常用的方法
三、axis(轴使用的说明)、增加删除数据列的操作
在增加列的时候我们用到了一个索引loc,后面我们再详细对loc进行说明,此处先知道可以这样使用。
四、缺失值和文本字符串的处理
文本字符串数据处理之前,一定要先转为字符(.str)再进行处理
五、索引设置和索引提取数据(loc / iloc)
loc 和 iloc如果容易记混,你就取巧记忆,index是索引
所以iloc则是依据位置索引进行取数,没有i的则是按照名称进行提取数据
六、数据的查询、修改和分组计算
最后:我们来看表连接和数据透视表的操作
原谅我很懒,比较喜欢这样框架式的笔记,所以文字就会比较少(#^.^#)!!!