这里以前段时间很火的一部动漫鬼灭之刃为例,剧场版截至目前已超350亿票房。
数据怎么来
要想做数据分析,首先要有数据来源,通过Python实现弹幕爬虫就能简单得到动漫视频数据。
动漫视频分为好多集,对每一集弹幕信息做爬取,需要我们知道每一集的ID信息。
如下图所示,这是第一集的视频ID。
image.png
没开会员的同学就只能看到一集的数据了。没关系,我已经爬取下来了。数据往下看。
由于篇幅原因,这里放部分爬虫代码。
image.png
运行完爬虫代码,即可得到一系列.csv文件。
不运行上面爬虫代码获取没关系,我已经替大家爬取下来了,大家可以直接用来做数据可视化。
这里主要用到csv(用来解析.csv文件),pyecharts(可视化输出),pandas(数据处理)模块包。
这里直接展示效果图。
柱图
image.png
饼图
image.png
折线图
image.png
云图
image.png
更多信息,请参考原文