有日子没有用pandas,趁着周末回顾下,手边有本书《Python数据分析实战》,就用这本书来最为教材了。
navigator
anaconda这个东西一直没有整得特别明白,比如平时用的时候,都是用Navigator

那我用这个命令的时候怎么切换环境呢?

- 查看当前虚拟环境
conda env list

我这里现在有两个,这个Oracle是前几天测试pandas连接Oracle时候搞的,默认进去的是默认环境,切换的话,使用
conda activate xxx

这样就可以切换到我们想要使用的环境了。
验证pandas是否已经安装好
conda list pandas

出现了pandas的版本信息应该就没啥大问题了,我们就可以开始使用了。
连接数据库
这里,我们使用MySQL数据库,详情参考上一篇文章:
pandas连接mysql
我们获得的是这样一组数据

基本使用
DataFrame是常用的一种数据结构,可以把它当成是一个Excel,数据库中的一个表,有行有列。看看我们上面获取的结果集,是一个员工表,有6个字段,10条记录。
- 查看所有的列名
print(df.columns)
print(type(df.columns))

我们得到的是一个Index,包含了所有的列名,我们可以根据列名获取指定列的数据
比如这样:
df[['emp_no','first_name']]

当我们只选取一列的时候,有两种方式:
print(type(df['emp_no']))
print(df['emp_no'])
print(type(df[['emp_no']]))
print(df[['emp_no']])

都可以,但是返回的数据类型是不一样的,按需使用。
- 查看所有的行
从行的角度来看,也有一个索引
我们一共有10条记录,默认会为我们生成一个Index
print(df.index)
print(type(df.index))

这里顺路说一下,上面我们获取了行索引,列索引,我们同样可以获取到所有的数据
df.values

记住这3部分 index、columns、values
- 获取某一行记录
使用iloc函数
print(df.iloc[1])
print(df.iloc[[1,3]])

还有另一种方式
print(df[1:3])
