20160707收获<关于抓取斗鱼弹幕>

只是简单的阅读了一下大神们的思路。粗略的学习使用了一下wireshark。

大神们的数据是不能用的,过时了。首先通过关闭直播间的视频,这样能排除掉视频数据的数据包。

于是接下来判断出哪些是弹幕的数据包就非常简单了。

目前只做到这里。然后学习了一下关于TCP的三次握手以及与HTTP协议的关系。

接下来的思路就是从头到尾重新抓取一下进入斗鱼直播间的数据包,根据端口或者网址将弹幕部分的数据包完整的获取下来。分析出如何进行交流以及获取弹幕。

另外,中间的连接貌似是一种能够一直持续的连接,以前听说过,但是一直没有接触过。websocket是什么鬼。这个能否仅仅靠爬虫知识解决?目前我所使用的爬虫功能只是简单的利用session向服务器端发送get,post请求而已。

未完待续。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容