一、构造DataFrame
一开始认为DataFrame都是数据导入的,但是绘制图形时需要多次数据处理,分类汇总、切分归类,还是需要构造一个DataFame用于图形绘制。
df2 = DataFrame({
'articles':['0','1','2-7','8-15','16-31','32-100','101-200','200+'],
'users':[df[df.articles.between(0,0)]['_id'].count(),
df[df.articles.between(1,1)]['_id'].count(),
df[df.articles.between(2,7)]['_id'].count(),
df[df.articles.between(8,15)]['_id'].count(),
df[df.articles.between(16,31)]['_id'].count(),
df[df.articles.between(31,100)]['_id'].count(),
df[df.articles.between(101,200)]['_id'].count(),
df[df.articles.between(201,1000)]['_id'].count()]
})
二、绘制柱形图
index = np.arange(df2['articles'].size)
plt.bar(index,df2['users'],1,color='G')
plt.xticks(index+1/2,df2.articles)
plt.show()
(简书用户样本数据:122,475 )
- 70.45%的简书用户没有写文章
- 21.64%的用户写了不到7篇文章
- 在简书上写了超过100篇文章的用户有330人 占0.27%
问题 1.中文处理 2.图表的标签没有在正确位置显示。