B站某视频弹幕抓取

爬虫这东西很实用,意义不下于你学会做PPT和Excel。真正掌握方法论很难,需要时间和不断的实践。但掌握一门小工具,投入和产出比在我看来是比较惊人的。

爬虫其实没有这么难。最近在三节课上上了一堂陈大欣老师的课,随手做做课程笔记+作业。

抓取链接:忘了,B站随便点开的一个视频;

主要思路:

1. 这个是做到现在我觉得挺好玩的一个抓取,不是做的爬虫,就直接在chrome查找到xml文件,点击打开位New Table;

2. 打开Excel-数据选项卡-自网站,粘贴到这个tab的链接,然后就能做了;

3. 关于时间,需要换算一下,公式在表里面;

4. 另外,这张表里有两个时间,一个是发布时间,即2016年6月28日(在下面不知道怎么公式没显示出来,但是下载后的excel发布时间这一栏显示的就是正常年月日+时间);另一个是时长,即弹幕在这个视频中是什么时候发的。

5. 这两个都涉及到excel数字格式的使用,例如时长是 1313s,如何转换成X分X秒呢?可以用到两个公式。

=INT(H16/60)&"分"&MOD(H16,60)&”秒”,Int函数取整,Mod函数求余,&连接;

=TEXT(H16/(60*60*24),"m's”)

6. 数据透视表,汇总,计数,可以看到多少分多少秒,有多少弹幕;这个东西是最好玩的,如果没有耐心看完整个视频,只需要在挑个弹幕数量最多的时间点High一下就行了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,799评论 25 709
  • 在简书发现一篇有趣的文章:爬虫,走起,用Excel实现5min抓取B站弹幕及初步处理讲到了如何根据开发者工具,获得...
    X_xxieRiemann阅读 10,397评论 2 10
  • 翻着那老旧了的照片/ 感慨青春稚嫩的岁月/ 一恍匆匆过了多少年/ 时光轴转着年少的执...
    无心沉默阅读 1,508评论 4 1
  • 7月2日凌晨长沙洪峰过境,突破了98年最高峰值; 7月2日早上下了20天的雨终于停了,长沙全城抗洪抢险; 7月2日...
    言吾悦阅读 2,812评论 0 1
  • 姓名:母光艳 公司:宁波贞观电器 第235期,利他二组 【日精进打卡第22天】 【知-学习】 读诵《六项精进》大纲...
    母光焱阅读 708评论 0 0