2019-12-16 字符串离散化

Example 1  分离逗号文件并改写新列表

代码

细节解释

2.数组合并中join方法 : 默认情况下把行索引相同的数据合并到一起 

merge : 按照列索引来进行合并 xx.merge(xx, on = "条件") 取并集

删除有缺失的为df.dropna(axis = 0)

3.数据的分组聚合

Example 2 统计两个国家的某品牌店面的数量

关键函数   xx = df.groupby("关键字")结果仍为dataframe型数据  聚合方法 xx.count()

常用的函数

两组及其他分组聚合方法:

如果想返回DataFrame类型,则给取的该列多加一个 [ ]  如 df[ ["Country" ] ]

4.索引和复合索引

简单的索引操作:

获取索引  df.index      指定索引:df.index = ['x','y']     重新设置索引:df.reindex(list("abcd"))      指定某一列作为索引 df.set_index("country",drop = false)             返回index的唯一值   df.set_index("country").index.unique() 相当于去重

5.Example 5

代码1


代码2

6.Example 6 

统计10000本书中,1.不同年份的书的数量  2.不同书的平均评分

示例代码书
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容