2019-12-16 字符串离散化

Example 1 分离逗号文件并改写新列表

代码

细节解释

2.数组合并中join方法 : 默认情况下把行索引相同的数据合并到一起

merge : 按照列索引来进行合并 xx.merge(xx, on = "条件") 取并集

删除有缺失的为df.dropna(axis = 0)

3.数据的分组聚合

Example 2 统计两个国家的某品牌店面的数量

关键函数 xx = df.groupby("关键字")结果仍为dataframe型数据聚合方法 xx.count()

常用的函数

两组及其他分组聚合方法：

如果想返回DataFrame类型，则给取的该列多加一个 [ ] 如 df[ ["Country" ] ]

4.索引和复合索引

简单的索引操作：

获取索引 df.index 指定索引：df.index = ['x'，'y'] 重新设置索引：df.reindex(list("abcd")) 指定某一列作为索引 df.set_index("country"，drop = false) 返回index的唯一值 df.set_index("country").index.unique() 相当于去重

5.Example 5

代码1

代码2

6.Example 6

统计10000本书中，1.不同年份的书的数量 2.不同书的平均评分

示例代码书

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

2019-12-16 字符串离散化

2019-12-16 字符串离散化

相关阅读更多精彩内容

友情链接更多精彩内容