账号可查数据均来自本班期的学员(抽取约 80%),具体可查的数据、权限已作处理,但仍包括一定程度的敏感内容。希望你切勿将账号扩散给他人。
学习了几种利用数据观察业务的套路后,我们希望你能从不同角度观察同一批数据,借此体会不同分析套路的特点与适用场景,并能从多个思考角度客观理解和思考业务。
任务清单
观察事件「浏览课程内容」,按「班期名称」查看,看看你的同班同学们还在学习哪些其他课程。你能从中找到本班的学霸么?(“学霸”可以自己定义,找出一个即可)
通过观察用户属性中的「首次广告系列来源」,看看本班同学一般都是从哪些渠道注册来到三节课的。
找到 12 月 6 日凌晨 4 点还在学习的这位勤劳的同学,通过数据了解这位同学,反推他日常的学习行为与特征,并描述。
描述本班期同学日常的每天学习时间分布,并(仅从单日耗时最长的角度)找出最“刻苦”的那位学员。
完成上述任务后,可从如下角度与大家分享你在完成作业的过程中的体会与心得:
(注:此部分无关对错,只需如实交流你的真实体会即可)
观察数据的过程之中,哪些洞察符合你的预期?哪些发现初看令你意外、细想又确有道理?
你能在这些数据中,找到你自己么?你是通过什么方法找到的?
借助这批数据,你还发现了什么“有意思”的事情,愿意与我们分享?
基本任务
1.按照要求输入条件之后,将本班同学正在学习的课程导出,进行分列、排序和排重处理之后得到本班期同学还在学习的课程列表:
寻找本班的学霸:
①先通过系统筛选12月每天都在学习的用户ID;
②再将这20人的ID录入系统查看他们每天学习的时长,6个小时以上的有两位,126627、1329627;
③再观察这两位同学的学习相关行为——浏览课程内容、笔记模式点击、在线课程-章完成、笔记保存、完成思考题,126627的整体数据表现更好一些,所以评定ta为本班学霸。
2.点击用户ID进入用户属性列表,将数据导出并用透视表分析,253人里有162个未显示注册来源,剩下的91人主要注册来源是订阅号和百度搜索,分别占了22%和8%。
3.查找过程:
①按照浏览课程内容的触发用户数,按班期名称查看,时间选择为12月6日这天,按小时显示;
②拉到下方明细表里可看到12月6日凌晨4点还在学习的课程是互联网业务数据分析实战,点击用户数量下划线进入该用户详情页查看,用户ID12324043;
学习行为与特征:
①11月15日首次注册,目前只能查到互联网业务数据分析实战课程在学,推测只报了这一门课程;
②查看用户浏览课程所使用的浏览器来看,该同学偏好使用三节课服务号听课,在使用PC端学习时未使用过笔记模式,推测该同学可能喜欢线下记笔记;
③12月6日之后学习频次明显下降,只有12月9日(周日)提交了一次作业,推测该同学可能因为工作繁忙而影响了课程学习;
④按学习时间来看,该同学最早开始学习的时间是8点到9点之间,但当日0点到1点之间也有学习记录,可以推测该同学有早起的习惯。
4.学习时间分布:37%左右的同学每天学习时间小于2h,26%的同学每天学习时间在2-3h,16%的同学每天学习时间在3-4h,9%的同学每天学习时间在4-5h,6%的同学每天学习时间在5-6h,3%的同学每天学习时间在6-7h,2%的同学每天学习时间在7-8h,1%的同学每天学习时间在8h以上。
最“刻苦”的同学为图中红框标记处,ID为2562707
体会与心得
我找到自己的方法比较直接--我发现了distinct ID就是学号,所以直接按照我的学号去筛选了自己的数据。
这次观测数据我发现有意思的事情是,周末学习人数没有我预想的那样比工作日高很多,反而周末是最低点,推测大家多为互联网从业者,平时工作都比较忙,周末会想多休息。