1,前序
本篇文章爬取了知乎上的 有哪些让你不得不服气的神逻辑? 的答案,一共爬取了100条数据左右,分别收集了答题者名字、粉丝数量、性别、头像图片链接,答案评论数、点赞数等方面数据,刚好自己最近在学 matplotlib 和 pandas; 就利用这些数据做了个简单分析,巩固一下知识!
2,数据可视化与分析
2.1 答案点赞数与评论数正相关
对于知乎上问题的答案来说,点赞代表对答案内容的认同,点赞数越多表示这个答案越受欢迎;这里针对于点赞数,首先做了一个与评论数相关的可视化图标,从图表来看,评论数跟点赞数被拟合在一条一元一次函数上,呈现正相关走向
2.2 对于一个问题的回答热度,最高点并不是在问题刚出来时
从图表上来看,一个问题刚被提出来的时候,回答者并不多,但随着回答数量不断增加,问题的热度也在逐渐增高,回答者也会越来越多,期间会达到一个顶峰,达到顶峰之后热度逐渐下降,最终达到平稳期,就类似于图表的右端处,答题者数量基本不再变化
2.3 答题者的粉丝数与内容受欢迎程度关系不大
先解读一下这个图标,横坐标是答案点赞数排名(从第一到第三十);纵坐标指的是对应答题者的粉丝数量
对于小标题中结论: 粉丝数量与答案受欢迎程度关系不大 ,只是我的一个猜想,不能确定这个分析对不对;可能有同学会反驳说,图表在开始的一段时间展示的是随着排名减少粉丝量也在逐渐减少,说明,粉丝量多的答主,其答案受到的欢迎程度也会越大
如果对于科普性的问题这种关系是成立的,答主粉丝量越多,其答案受欢迎程度也越高;但是本次分析的问题 :有哪些让你不得不服气的神逻辑 却不在这一列;
并且,粉丝量大也有可能是在回答完这个问题之后,由于问题的比较受欢迎从而带来的粉丝,而且这个问题提出时间在18年,太早了,选取的分析对象并不是太好
2.4 点赞数与答主的性别关系不大,靠的是内容取胜
上面这个表把采集的答案中,对于点赞数排了个序,取出了前20名,并且分别对于回答者不同性别用不同颜色做了标注,对应关系分别为:红色—女、蓝色—男、灰色—未知;
柱状图上显示来看,答主性别与答案点赞数排名并没有太大关系;如果仔细看一下点赞数,其实差别不大,暂且不分析未知性别,点赞排名高的不仅男性有女性也有,虽然前20名女性相对于男性占比较少,但是点赞总数加起来丝毫不弱;因此对于一个答案的质量好坏,性别并不占优势。
3,精彩答案
这一部分我从点赞数排名比较高的几个答案中,并且选取了几条篇幅不太长的,让大家细品一下:
我:“爸,同学约我出去玩” 爸:“哪?” 我:“xx路” 爸:“不行,太乱了。想去,让你妈陪你去。” 我:“哦” …… 以上对话重复多次以后 …… 突然有一天 爸:“你说你,那么长一个假期,就没一个同学找你出去玩,你这交际能力也太差了xxxxxxxxxxxxxxxx”(此处省略无数教导) 我:“……” 爸:“要学着跟同学交往,知道不” 我:“那我能周末去跟同学看电影吗?” 爸:“哪” 我:“xx” 爸:“从家又不是不能看,最近外边多乱” 我:“⊙∀⊙!哦”
简而言之,我从小到大和我爸总会处在这个循环中 —— 同学邀我出去玩,我爸不允许,我无奈拒绝同学。拒绝多次之后没有同学找我,我爸开始各种嫌弃我的交际能力,说我成天玩手机都玩傻了。然后偶然又会有不了解情况的新朋友约我,然后被我爸严词拒绝,继续重复以上情况。 我爸这逻辑,从小学折磨我到现在大二,我真的服气了。
各位厉害,小女子掩耳盗铃地把地点去掉了,就当心里安慰了。各位看破不说破哦。谢啦!喵~
(承蒙厚爱,不胜感激,谢绝转载)
[图片上传失败...(image-e60e43-1582018009366)]
作者: 凉生
相亲。
男:我没房。
女:没事,可以先租着。
男:我没车。
女:坐公交,走路环保健康。
男:我也没存款。
女:以后会更好的,要相信自己。
男:那我们。。。?
女:哦对了,你喜欢什么颜色?
男:红色。
女:那不好意思,我喜欢黄色,我们不合适。
作者: 戴彩衣
我就放个图片吧
作者 :杨高聪
只有娘炮,才干女人。真男人,就应该干男人。
作者 Siyix
4,照片墙
最后放上一张照片墙,这个照片墙是由采集数据中答题者的图像绘制而成的,照片墙的就是 刘看山的轮廓,关于照片墙的制作方法,可以参考之前的文章:
文中涉及的所有源码、数据获取方式,关注微信公众号:小张Python,后台回复关键词:神逻辑 即可。