《疯狂数据分析》第一周成员学习情况分析

背景

近期,群主凡人求索和他的小伙伴们一起组织了疯狂数据分析小组,通过有计划的输入,每周总结一篇数据类文章,分别投稿到 疯狂数据分析专题 ,并坚持一年时间。
组长上周发布的作业为制定数据分析学习计划,并发布在疯狂数据分析专栏,截止时间为:2018年12月17号12点。
本篇报告通过收集疯狂数据分析专栏成员交作业的情况,对学员学习情况进行分析。

数据获取

获取数据方法借鉴了群主凡人求索的文章 数据分析实战---通过爬虫管理社群作业
基本思路:requests+BeautifulSoup+pymysql,将爬取到的数据保存到MySQL中。
爬取数据字段:name:简书用户ID title:文章标题 publish_time:发布时间 word_age 字数

数据导入

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

import pymysql
dbconn = pymysql.connect(host='localhost',database='spiders',user='root',password='123',port=3306,charset='utf8')
sqlcmd = "select * from exercise2"
data = pd.read_sql(sqlcmd,dbconn)
data.info()
data.head()
data.name.nunique()
整体情况

数据样本.PNG

截止到12月17号上午10点疯狂数据分析专栏共收录了69篇文章,共有51名成员在专栏上发布了他们的学习计划。

数据清洗

发布时间

from dateutil.parser import parse
data.publish_time = data.publish_time.str.strip('*') #清楚发布时间里面多余的*
for i in data.publish_time:
    i = parse(i)                
data.publish_time = pd.to_datetime(data.publish_time)  #将发布时间转化为datetime类型
data['date'] = data.publish_time.dt.day
data['hour'] = data.publish_time.dt.hour

字数

data.word_age = data.word_age.str.strip('字数') #删除字数字段多余的“字数”
data.word_age = data.word_age.astype('int')  #将类型转换为int类型

数据分析

提交作业时间

第一周成员提交作业时间

大部分成员在15号和16号提交作业,也就是上周六和周天的时候。


一天中提交作业次数变化对比

作业提交次数较大的集中在两个时间段:上午11点-12点,晚上22点-24点

文章发布篇数

data.groupby(['name'])['title'].count().sort_values(ascending = False).head(5)
文章发布篇数.PNG

夜希辰和我们的群主大大凡人求索在上一周中都输出了5篇文章。1点点De小任性、,Lykit01,肖月_1d28发布了3篇文章。大部分成员都只发布了1篇文章,完成基本任务。

文章字数

data.groupby(['name'])['word_age'].sum().describe()
文章字数.PNG

累计文章字数最多的在上一周中已写了8617字,最少的写了64个。可以看出差别蛮大!平均每位成员的写作字数为903字。看看你达到平均水平了吗? 小佳我可以很自豪的说,嗯。。 及格了!

data.groupby(['name'])['word_age'].sum().sort_values(ascending = False).head(5)
累计写作字数.PNG

累计写作字数最多的是夜希辰8617个字,其次是Lykit01,1点点De小任性。

文章标题词云分析

from wordcloud import WordCloud
import jieba
text = ''
for line in data['title']:
    text += line
cut_text = ' '.join(jieba.cut(text))
cloud = WordCloud(background_color='white',font_path = './fonts/simhei.ttf',max_words = 1000)
word_cloud = cloud.generate(cut_text)
plt.imshow(word_cloud)
plt.axis("off")
plt.show()
文章标题词云

不用多说 学习计划 数据分析 Python SQL 统计学
符合组长定下的目标,第一周:制定数据分析学习计划

总结

  • 疯狂数据分析学习小组在上一周中共收录了69篇文章,51名成员在专栏上发表了他们的学习计划。
  • 大部分成员在周六周天发布他们的文章。
  • 成员活跃的时间段:11-12点 22-24点
  • 大部分发表的文章篇数 1篇,最多的在一周中已发表5篇文章。
  • 平均写作字数 903字,最多的累计写作字数达到8617字。
  • 文章主题:制定数据分析学习计划!
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,920评论 2 89
  • B612行星很小,小王子也不大。 是,我是说他很小,比行星还要小。小王子没有佩剑,却拥有一朵傲娇的玫瑰。 很多年前...
    一个人的日记本阅读 518评论 0 2
  • 分享汇——共享广告 你想不想让朋友圈的热点文章中都带上您企业的广告 你想不想让您的员工、亲朋好友成为您企业的推广员...
    bfcf007c9c70阅读 175评论 0 0
  • 欢迎关注微信公众号:阅微小悟 2017年10月25日星期三 晴天 按照计划,明天才写这篇文章的, 但似乎明天晚上有...
    章小疯阅读 747评论 2 0