pandas深入学习-导入文件和查询函数

一、导入csv文件

pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'))

细节:横杠打反,代码里的横杠和文件路径显示横杠是相反的

####更改索引:

pd=pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'),names=list('abcde'))

二、注意查询的注意点(斜体字部分)

query查询:

df.query("网站情况 =='未嵌码'&编号>700") 字段名

结果是一个数据框,还可以对这个数据库进行数据查询:

df.query("网站情况 =='未嵌码'&编号>700")[["主域名","名称"]]

直接查询:

df[(df.网站情况 =='未嵌码')&(df.编号>700)]

也可以对这个数据框进行相应的查询:

df[(df.网站情况 =='未嵌码')&(df.编号>700)][["主域名","名称"]]

某个字段满足条件,得出来的是布尔类型

(df.网站情况 =='未嵌码')&(df.编号>700)

####数据库再查找某一列等价形式

df[(df.网站情况 =='未嵌码')&(df.编号>700)] ["主域名"]

等价于

df.query("网站情况 =='未嵌码'&编号>700").主域名

####还可以继续作过滤

df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn'

其中  df[df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn']外面加一个切片报错,因为里面的数据库的条数少,df数据库条数多,所以必须内部的切片与外部的数据框两者要对应上

三、iloc、loc、ix的练习

ix

df.ix[0:2]

iloc

df.iloc[0:2,1:3]

loc可用于标签

df.loc[0:1,['编号','名称']]

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。