Pandas的利剑DataFrame

零基础学Pyhton数据分析 >> Pandas >> DataFrame创建

前言

大家好,这里是零基础学Python数据分析系列。

这个系列所有的代码编写均是Python3版本。

喜欢的朋友们可以点个关注,有问题欢迎随时和我交流。

本文的内容是Pandas的核心数据结构DataFrame的创建。包括了怎样把字典和列表的数据结构转化成DataFrame的数据结构。

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

DataFrame简介

如果说,Numpy、Pandas、Matplotlib是Python数据分析三剑客,那么DataFrame绝对是Pandas最好的利剑。

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

简单理解:Pandas是编程界的Excel,DataFrame就是excel中一张表,对DataFrame操作,就是将excel表操作用Python代码来实现。

一个常规的DataFrame数据结构如下:

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

第左边一列是它的索引(可以理解为是excel表的序号。但索引不一定是顺序的,也可以是重复、断续的),最上面一行是它的列名(就是每一列代表的含义)。

是不是非常的简单直观。

熟悉了DataFrame的结构后,让我们开始创建一个DataFrame吧。

DataFrame创建,pd.DataFrame()

导入Pandas包,并命名为pd。

import pandas as pd

创建一个空的DataFrame

创建一个完全空的DataFrame

输入:

df = pd.DataFrame()df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

啥也没有,因为是完全空的DataFrame。

创建一个空的DataFrame,带列名

输入:

df = pd.DataFrame(columns=['姓名', '性别', '年龄', 'Python成绩'])df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

参数columns:列表形式,可以指定创建的DataFrame的列名。

创建一个空的DataFrame,带索引

输入:

df = pd.DataFrame(index=['姓名', '性别', '年龄', 'Python成绩'])df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

参数index:列表形式,可以指定创建的DataFrame的索引。

到这里,就实现了用pd.DataFrame()函数创建一个空的DataFrame。

那么怎样将Python常用的其他数据类型转变成DataFrame呢。比如字典、列表如何转化成DataFrame呢?

image.jpg

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

让我们继续,看看怎样将字典和列表转化成DataFrame。

字典创建DataFrame

先创建一个常规的学生Python成绩的字典,注意字典的值是相同长度的列表

# 字典的值是相同长度的列表Student_dict = {'姓名':['张三', '李四', '王五', '赵六'],                '性别':['男', '女', '男', '女'],                '年龄':['20', '21', '19', '18'],                'Python成绩':['70', '80', '90', '50']}

字典创建DataFrame,字典的键变DataFrame的列名

输入:

df = pd.DataFrame(data=Student_dict)df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

直接把字典Student_dict放入pd.DataFrame()函数中,就可以转成DataFrame啦,只不过字典Student_dict的键会变成DataFrame的列名。

那么我希望字典的键可以变成DataFrame的索引应该怎么办呢?

字典创建DataFrame,字典的键变DataFrame的索引

非常简单,虽然pd.DataFrame()函数没有相关功能,但我们只需要把生成的DataFrame进行转置就可以啦。(DataFrame转置方式df.T)

输入:

df = pd.DataFrame(data=Student_dict).Tdf

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

上面介绍了字典的值是长度相同的列表时转DataFrame的方式,如果字典的值是长度不同的列表,会怎样呢?让我们来试一下。

字典的值是长度不同的列表时

再创建一个学生Python成绩的字典,只不过这次学生赵六的Python成绩缺失了。

# 字典的值是长度不相等的列表Student_dict_new = {'姓名':['张三', '李四', '王五', '赵六'],                    '性别':['男', '女', '男', '女'],                    '年龄':['20', '21', '19', '18'],                    'Python成绩':['70', '80', '90']}

输入:

df = pd.DataFrame(data=Student_dict_new)df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

报错啦,All arrays must be of the same length,所有数组必须具有相同的长度,看来字典转DataFrame,字典的值如果是列表,那么一定要是长度相同的列表才可以。

还有一种情况,如果字典的值不是列表,而是标量(就只有一个值意思),还可以用上面的方式将字典转化成DataFrame吗?让我们来试试。

字典值是标量而不是列表时

再创建一个学生Python成绩的字典,只不过这次只有一个学生,字典的值是标量(就只有一个值)。

# 字典的值是标量(就只有一个值),如下Student_dict = {'姓名':'张三',                '性别':'男',                '年龄':'20',                'Python成绩':'70'}

输入:

df = pd.DataFrame(data=Student_dict)df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

诶,又报错了,If using all scalar values, you must pass an index,如果使用所有标量值则必须传递索引。

image.jpg

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

所以说,如果字典的值是标量(就只有一个值),那么字典转DataFrame时,就必须加上一个索引index。

输入:

df = pd.DataFrame(data=Student_dict, index=[0]) df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

OK,到这里我们已经学会怎样将一个字典转化成DataFrame啦,再让我们看看怎样将一个列表转化成DataFrame。

列表创建DataFrame

先创建一个学生姓名的列表。

Student_name_list = ['张三', '李四', '王五', '赵六']

让我们试一下,直接用pd.DataFrame()会把列表转成怎样的DataFrame。

单个列表创建DataFrame,变成一列

输入:

# 单个列表创建DataFrame,变成一列df = pd.DataFrame(data=Student_name_list)df

输出:

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

我们可以看到,直接用****pd.DataFrame()会把单个列表转成只有一列的DataFrame,那么如果我想把单个列表转成只有一行的DataFrame该怎么做呢?

单个列表创建DataFrame,变成一行

输入:

# 单个列表创建DataFrame,变成一行df = pd.DataFrame(data=[Student_name_list])df

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

看输入,我在Student_name_list列表外加了[],把原本一维列表,变成了二维列表,输出的DataFrame就变成了一行

上面介绍了单个列表转DataFrame的方式,多个列表怎么转DataFrame呢?让我们用两个列表来试一下。

先创建两个列表,学生姓名和学生Python成绩。(两个列表长度必须相同)

Student_name_list = ['张三', '李四', '王五', '赵六']Student_pythonscore_list = ['70', '80', '90', '50']

两列表创建DataFrame,生成两列

输入:

# 两列表创建DataFrame,生成两列pd.DataFrame(data={'姓名':Student_name_list, 'Python成绩':Student_pythonscore_list})

输出:
image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

我们可以将两个列表,先转成字典,那么就可以生成两列的DataFrame啦。

两列表创建DataFrame,生成两行

输入:

# 两列表创建DataFrame,生成两行df = pd.DataFrame(data=[Student_name_list, Student_pythonscore_list], index=['姓名', 'Python成绩'])df

输出:

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

我们把两个一维列表,转成一个二维列表后,那么就可以生成两行的DataFrame啦。

本文关于DataFrame的创建就到此为止啦,更多有关DataFrame的操作可见主页零基础学Pyhton数据分析系列。

彦祖,点个赞呗。

image.jpg

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

后记

Python真的非常适合做数据分析,如果你对数据很感兴趣,那学好Python,成为一名数据分析师或者算法建模师一定是一个不错的选择。

原创不易,每一个知识点都是我在工作中常用的,初心是为了分享,所以希望大家能多多支持,关注点赞转发,有什么问题欢迎在后台联系我。

加油,骚年!

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">图片</figcaption>

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,402评论 6 499
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,377评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,483评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,165评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,176评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,146评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,032评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,896评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,311评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,536评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,696评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,413评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,008评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,815评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,698评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,592评论 2 353

推荐阅读更多精彩内容