大噶好,介绍一下我的新女儿:
❗B站播放量3243.4万
❗在超严格的豆瓣,评分达到9.0
❗完结后半个月,工作日的16:09,还有317个阿宅陪我一起看
除了《工作细胞》还有谁!
这是一个关于你自身的故事。你体内的故事——。
人的细胞数量,约为37兆2千亿个。
细胞们在名为身体的世界中,今天也精神满满、无休无眠地在工作着。
运送着氧气的红细胞,与细菌战斗的白细胞……!这里,有着细胞们不为人知的故事。
主要细胞大放送
红血球
代号AE3803
新手社畜,主业是迷路+谈恋爱,副业是搬运氧气
声优:花泽香菜(prprpr)
白血球
代号U-1146
懒得涂色系列,武力值MAX,负责驱逐侵入身体的细菌和病毒。
声优:前野智昭
血小板
血管发生损伤时,集合起来堵住伤口。
声优:长绳麻理亚(也是康娜酱的CV哟!)
巨噬细胞
是温柔的女仆装大姐姐啊!负责捕杀细菌病毒等异物。
声优:井上喜久子
13话根本不够看嘛1551
所以!
我们抓取了近八千条豆瓣评论,想看看大家都在聊什么。
这里感谢科赛社区的小伙伴“柑橘与柠檬啊”用爱发电,做出了这份豆瓣评论分析。
查看“项目源码”请戳:科赛 - Kesci.com
爬取数据
到达战场:豆瓣
首先找到我们需要的语料数据:
先看看大家都说了什么:
(那个不敢抠结痂块的等等我,我也不敢了QAQ)
但是七千多条...
算了,看不完...
开始爬取数据:
这里我们常规操作,用beautifulsoup进行爬虫,再用正则表达式re和beautifulsoup去除非文本内容:

可 视 化
打开matplotlib,开始画图!
首先我们用原有数据绘制词云图:
从图上,我们可以看出,大家比较多的评论是:
“血小板”
“太可爱了”
“这是一个关于你自身的故事”
“低龄向科普番”
“约为37兆2千亿个”
“我身体里的红细胞和白细胞都谈恋爱了” 那所以你怎么还是单身?
也有一些反面的评论,典型的如:“一集弃”。
(那我就少一个情敌了。)
分 词
不过上面的句子太长了,我们还想看看哪些关键词最频繁。
这里我们用到了Python中中文分词比较优秀的jieba,短短几行就能完成分词工作:

基于 TF-IDF 算法,我们提取出了关键词,并做成了DataFrame文件:
Matplotlib!过来画图!
从词云图可以看到,大家聊得比较多的词汇是
“血小板”(高居第一不动摇)
“细胞”、“科普”、“身体”、“可爱”、“知识”......
词云图也要萌
细胞们这么可爱,词云图也要可可爱爱啦!
所以最后,我们再为词云加一个喜欢的蒙版。
这里,我们找到了一张图:
就决定是你了!

最后得到:
科普番
纵观整个词云,不难看出大家的关注点主要在这两点上:
爆炸可爱的血小板
科普番
作为一个科普番,《工作细胞》无疑是成功的。
《工作细胞》改编自清水茜老师的同名漫画,不仅仅是阿宅们用爱发电,这部漫画也是老师用爱写出来的:
清水茜老师对医疗相关的内容完全不懂,细胞什么的,她也只知道高中课本上的那些知识。可是她妹妹在学习细胞方面知识的时候,想着如果画成漫画就容易记住了,于是就拜托她的姐姐——清水茜老师画出来了。所以,才有我们看到的《工作细胞》。
从爬取出来的数据中,我们摘取和“科普”相关的一些来看:
“低龄向科普番”
“因为科普漫加一星”
“了解身体状况的同时还被秀一脸”
“不好好活着都对不起身上努力的细胞们啊”
......
同样,它也受到了一些质疑,比如:
“这些只是高中知识”
“略显低龄”
“很多地方不符合医学事实,比如白细胞的寿命一般只有几天”
......
但作为一个入门科普番,小科觉得这些瑕疵完全大丈夫!
它已经激发了很多人的兴趣,把枯燥的生物知识用万物皆可萌的形式带给我们,甚至部分中学把“观看《工作细胞》”当成假期作业,大家在面对书本上干巴巴的图之外,还有另一种选择。
图为中学课本常见插图
就像《Fatego》出现后,有些人会因为喜爱去了解那一段历史,看完《四月是你的谎言》后有些人开始对古典乐感兴趣...
图为《Fate》玩家在论坛发表的三万字考据帖
我始终相信,兴趣是专业的开端。
最 后
为了身体里这些细胞,我们也要爱惜身体呀。
以及感谢清水茜老师没有画头发细胞,不然每天看着我掉落一地的头发,太、太残忍了...
欢迎大噶来科赛网kesci.com,与小科一起玩耍~