pandas深入学习-导入文件和查询函数

一、导入csv文件

pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'))

细节：横杠打反，代码里的横杠和文件路径显示横杠是相反的

####更改索引：

pd=pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'),names=list('abcde'))

二、注意查询的注意点（斜体字部分）

query查询：

df.query("网站情况 =='未嵌码'&编号>700") 字段名

结果是一个数据框，还可以对这个数据库进行数据查询：

df.query("网站情况 =='未嵌码'&编号>700")[["主域名","名称"]]

直接查询：

df[(df.网站情况 =='未嵌码')&(df.编号>700)]

也可以对这个数据框进行相应的查询：

df[(df.网站情况 =='未嵌码')&(df.编号>700)][["主域名","名称"]]

某个字段满足条件，得出来的是布尔类型

(df.网站情况 =='未嵌码')&(df.编号>700)

####数据库再查找某一列等价形式

df[(df.网站情况 =='未嵌码')&(df.编号>700)] ["主域名"]

等价于

df.query("网站情况 =='未嵌码'&编号>700").主域名

####还可以继续作过滤

df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn'

其中 df[df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn']外面加一个切片报错，因为里面的数据库的条数少，df数据库条数多，所以必须内部的切片与外部的数据框两者要对应上

三、iloc、loc、ix的练习

df.ix[0:2]

iloc

df.iloc[0:2,1:3]

loc可用于标签

df.loc[0:1,['编号','名称']]