爬取B站弹幕可视化分析

这里以前段时间很火的一部动漫鬼灭之刃为例,剧场版截至目前已超350亿票房。

数据怎么来

要想做数据分析,首先要有数据来源,通过Python实现弹幕爬虫就能简单得到动漫视频数据。

动漫视频分为好多集,对每一集弹幕信息做爬取,需要我们知道每一集的ID信息。

如下图所示,这是第一集的视频ID。


image.png

没开会员的同学就只能看到一集的数据了。没关系,我已经爬取下来了。数据往下看。

由于篇幅原因,这里放部分爬虫代码。


image.png

运行完爬虫代码,即可得到一系列.csv文件。

不运行上面爬虫代码获取没关系,我已经替大家爬取下来了,大家可以直接用来做数据可视化。

这里主要用到csv(用来解析.csv文件),pyecharts(可视化输出),pandas(数据处理)模块包。

这里直接展示效果图。

柱图


image.png

饼图


image.png

折线图
image.png

云图


image.png

更多信息,请参考原文

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容