为帮助学习pandas,特意从和鲸社区中提炼出120道经典数据处理常见操作例题,从基础入门到进阶来更快速、更专业的角度理解pandas。主要包括:
- Pandas基础
- Pandas进阶
- 金融数据处理
- NumPy科学计算
- 一些补充
(https://www.heywhale.com/mw/project/5ef96ce863975d002c95fd8a/content)
正文:
Pandas进阶修炼120题之1:提取含有字符串"Python"的行
将字典创建为DataFrame
#将字典创建为DataFrame
data_dict={
"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","python"],
"score":[1,2,np.nan,4,5,6,7,10]
}
data = pd.DataFrame(data_dict)
[图片上传失败...(image-6ce113-1623502884917)]
数据理解:
通过观察数据可得:
1.数据列:grammer有两个python值
2.数据列:grammer中在第一行以及第7行分别对应的两个python值
实现代码:
方法一:根据上述理解,采用 | 获得两个python值
data[(data['grammer']=='Python') | (data['grammer']=='python')]
[图片上传失败...(image-fedbe-1623502884917)]
方法二:利用str.contains()函数
data[data['grammer'].str.contains('Python|python')==True]
[图片上传失败...(image-d9473a-1623502884917)]
方法三:数据列:grammer中在第一行以及第7行分别对应的python值,可利用iloc[],也就是行索引获得到
data.iloc[[0,7],:]
[图片上传失败...(image-f881a0-1623502884917)]
总结:提取含有字符串"Python"的行的数据,可以通过以上三种方法实现,大家可以根据自身情况,选择不同的方法。