只是简单的阅读了一下大神们的思路。粗略的学习使用了一下wireshark。
大神们的数据是不能用的,过时了。首先通过关闭直播间的视频,这样能排除掉视频数据的数据包。
于是接下来判断出哪些是弹幕的数据包就非常简单了。
目前只做到这里。然后学习了一下关于TCP的三次握手以及与HTTP协议的关系。
接下来的思路就是从头到尾重新抓取一下进入斗鱼直播间的数据包,根据端口或者网址将弹幕部分的数据包完整的获取下来。分析出如何进行交流以及获取弹幕。
另外,中间的连接貌似是一种能够一直持续的连接,以前听说过,但是一直没有接触过。websocket是什么鬼。这个能否仅仅靠爬虫知识解决?目前我所使用的爬虫功能只是简单的利用session向服务器端发送get,post请求而已。
未完待续。。。