Example 1 分离逗号文件并改写新列表
细节解释
2.数组合并中join方法 : 默认情况下把行索引相同的数据合并到一起
merge : 按照列索引来进行合并 xx.merge(xx, on = "条件") 取并集
删除有缺失的为df.dropna(axis = 0)
3.数据的分组聚合
Example 2 统计两个国家的某品牌店面的数量
关键函数 xx = df.groupby("关键字")结果仍为dataframe型数据 聚合方法 xx.count()
两组及其他分组聚合方法:
如果想返回DataFrame类型,则给取的该列多加一个 [ ] 如 df[ ["Country" ] ]
4.索引和复合索引
简单的索引操作:
获取索引 df.index 指定索引:df.index = ['x','y'] 重新设置索引:df.reindex(list("abcd")) 指定某一列作为索引 df.set_index("country",drop = false) 返回index的唯一值 df.set_index("country").index.unique() 相当于去重
5.Example 5
6.Example 6
统计10000本书中,1.不同年份的书的数量 2.不同书的平均评分