pandas选择数据

aiblog7.jpg

在此附上视频链接,想具体了解的朋友可以看看。

一、引入第三方库

首先我们引入numpy与pandas第三方库,如果没有安装的同学可以在命令行中pip install numpy 或 pip install pandas 进行安装

import numpy as np
import pandas as pd
二、需要用到的一组数据
dates = pd.date_range('20190424', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D'])

print(df)

先打印出这组数据,效果如下:
pandas01.png

三、一般选择选择方法(行列)

a.选择某一列

print(df[''A]) # 选择A这列
# 或者 print(df.A) 效果同上

b.切片选择

如下选择[0:3]行打印出来
print(df[0:3])
如下选择['20190425': '20190426']打印出来
print(df['20190425': '20190426'])

代码如下:

import pandas as pd
import numpy as np

dates = pd.date_range('20190424', periods=6)
df = pd.DataFrame(
    np.arange(24).reshape((6, 4)),
    index=dates, columns=['A', 'B', 'C', 'D']
)

print(df)
print('\n选择A列\n', df['A'])
print('\n切片选择区间[0:3]\n', df[0:3])
print("\n切片选择区间['20190425': '20190427']\n", df['20190425': '20190426'])

打印效果如下:
pandas02.png

三、用标签或者行号进行筛选

1.通过标签进行选择

选择20190425这一行
print(df.loc['20190425'])
所有的行都保留,筛选出 'A','B'这两列的数据
print(df.loc[:, ['A', 'B']])

代码如下:

import pandas as pd
import numpy as np

dates = pd.date_range('20190424', periods=6)
df = pd.DataFrame(
    np.arange(24).reshape((6, 4)),
    index=dates, columns=['A', 'B', 'C', 'D']
)

print(df)
print('\n选择20190425这一行')
print(df.loc['20190425'])

print("\n筛选出行为'20190424'列为'A','C'的数据")
print(df.loc['20190424',['A', 'B']])

print("\n所有的行都保留,筛选出 'A','B'这两列的数据")
print(df.loc[:, ['A', 'B']])

打印效果如下:
pandas03.png

2.通过位置进行选择

打印出第三行:
print(df.iloc[3])
第三行的第一位
print(df.iloc[3, 1])
切片选择 3:5行 1:3列
print(df.iloc[3:5, 1:3])
不连续筛选
print(df.iloc[[1, 3, 5], 1:3])

代码如下:

import pandas as pd
import numpy as np

dates = pd.date_range('20190424', periods=6)
df = pd.DataFrame(
    np.arange(24).reshape((6, 4)),
    index=dates, columns=['A', 'B', 'C', 'D']
)

print(df)
print('\n打印出第三行:')
print(df.iloc[3])
print("\n第三行的第一位")
print(df.iloc[3, 1])
print("\n切片选择  3:5行 1:3列")
print(df.iloc[3:5, 1:3])

打印效果如下:
pandas04.png

四、条件筛选(进行True或False的筛选)

筛选出A这列大于8的数(会打印出符合条件的这行,可以参照效果图理解)
print(df[df.A > 8])
代码如下:

import pandas as pd
import numpy as np

dates = pd.date_range('20190424', periods=6)
df = pd.DataFrame(
    np.arange(24).reshape((6, 4)),
    index=dates, columns=['A', 'B', 'C', 'D']
)

print(df)
print('\n筛选出A这列大于8的数(会打印出符合条件的这行,可以参照效果图理解)')
print(df[df.A > 8])

打印效果图如下:
pandas05.png

谢谢大家, 这里是这次的分享,如果有难理解的可以对照打印效果图进行理解,如果有需要了解更多相关知识的话可以看看我之前的博文或关注我的博客,谢谢大家。
欢迎大家在下方评论与留言或者给出建议,如有错误请指出。希望这篇博文能帮助到大家,也欢迎大家分享给需要的人。

如需转载,请注明出处。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,695评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,569评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,130评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,648评论 1 297
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,655评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,268评论 1 309
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,835评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,740评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,286评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,375评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,505评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,873评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,357评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,466评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,921评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,515评论 2 359

推荐阅读更多精彩内容

  • 学习资料: 相关代码 我们建立了一个 6X4 的矩阵数据。 简单的筛选 如果我们想选取DataFrame中的数据,...
    吴国友阅读 310评论 0 1
  • pandas 中选择数据的方法有很多种,一般我们会用到这几种.1.简单的筛选2.根据标签:loc3.根据序列:il...
    Ledestin阅读 511评论 0 1
  • Pandas是基于Numpy的一种工具,这个工具是为了解决数据分析任务而创建的,pandas纳入了大量的库和一些标...
    CDA数据分析师培训阅读 542评论 0 9
  • 整理归纳在Python中使用对数据处理的常用方法,包括与HDFS文件的读写,主要是怕用的时候记不住,容易搞混,再搜...
    shohokuooo阅读 4,203评论 0 50
  • 第21次约练 中十 谭娟 今天是本周约练第6天了,一次也没有约练。中午孩子成绩出来,也不够理想。我也想约练。 下午...
    蕾小姐爱学习阅读 185评论 0 0