groupby函数

还是以上文的数据为例子，进行讲解，首先读入数据，通过groupby聚合数据。（该数据为简书it互联网一段时间的文章收录信息）

import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')
jianshu = pd.read_sql('select * from jianshu1',conn)
group_user = jianshu.groupby('user')
group_user.groups

可以看出返回的有用户id和所在的索引位置以及数据类型。通过下面代码计算有多少用户。

len(group_user.groups)
#result 543

通过size方法进行统计显示：

size_user = group_user.size()
size_user

进行排序，取前十的用户。

sort_user = size_user.sort_values(ascending=False)
sort_user[0:10]

highcharts绘图

import charts
series = [{'name': 'Apple','data': [10],'type': 'column'},{'name': 'Android','data': [5],'type': 'column'},{'name': 'Other','data': [5],'type': 'column'}]
charts.plot(series,show='inline')

我们需要把数据整合为highcharts能识别的数据结构，然后进行绘制。

series1 = []
for i in a.index:
    data = {
        'name':i,
        'data':[a[i]],
        'type':'column'
    }
    series1.append(data)
charts.plot(series1,options=dict(title=dict(text='投稿前十用户')))

这里的a是前十的用户数据，也就是sort_user[0:10]。
最后祝愿全天下母亲节日快乐

最后编辑于：2017.12.07 06:02:37

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Python数据分析之dataframe的groupby

Python数据分析之dataframe的groupby

groupby函数

highcharts绘图

相关阅读更多精彩内容

友情链接更多精彩内容