登录注册写文章

从零开始做直播导航网站第四天

从零开始做直播导航网站第四天

关键词：
翻页 XHR JSON

思路：
用chrome F12开发者功能，查看翻页时Network的内容，确定爬虫翻页的实现方法

过程：
1.分析跳转的内容
chrome打开https://www.douyu.com/g_LOL
F12打开开发者功能，查看network的XHR

然后在页面上点击第二页跳转，继续查看network的XHR，发现一个名叫2的页面

我们直接在浏览器中打开https://www.douyu.com/gapi/rkc/directory/2_1/2
发现是一个json的文件，那么我们再打开
https://www.douyu.com/gapi/rkc/directory/2_1/1
内容也是json

里面返回的是第一页的各个主播直播间的内容，包括主播的url，name以及分类。

翻到最后

pgnct应该是总页数。

分析
我们现在可以通过https://www.douyu.com/gapi/rkc/directory/2_1/1已经总页数循环获得英雄联盟分类所有的主播信息，怎么获得其他的分类下的内容呢。本来英雄联盟的网址应该是 g_LOL，这里用的是2_1，有没有办法找到对应信息呢?
我们换一个分类看看，绝地求生这个分类，用同样的方法查看，得到的网址是https://www.douyu.com/gapi/rkc/directory/2_270/2。Dota2，https://www.douyu.com/gapi/rkc/directory/2_3/2。
那么大概可以知道，不同分类对应不同的https://www.douyu.com/gapi/rkc/directory/2_x/pageNumber。
3.方案
从1和2得到的内容，我们可以放弃从每个分类的主页去获取主播信息了，用https://www.douyu.com/gapi/rkc/directory/2_x/pageNumber来直接获取信息，直接拿到json内容进行分析，效率更高。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

redis集群3.3.3搭配redis软件3.2.8在centos/rhel 完整安装步骤
说明本次redis集群安装在rhel6.8 64位机器上，redis版本为3.2.8，redis的gem文件版本为...
读或写阅读 15,185评论 3赞 9
iOS kai
1.图片浏览控件MWPhotoBrowser 实现了一个照片浏览器类似 iOS 自带的相册应用，可显示来自手机的图...
万忍阅读 1,522评论 0赞 6
No.2 To云风:对错于你，无关他人言何物
Dear 云风：不知道你今天过得怎样？我的31号，有太多的突发状况与头痛，相信你已明了。且当你想和我说话的时候，...
Vecho阅读 259评论 0赞 0
难触子矜
壹清水镇，人声鼎沸，集市上是往来的商贩和采购东西的人群，孩童们手握着糖葫芦笑容满面地吃着，老人们拄着拐杖却也精气...
如月之白阅读 461评论 0赞 0
七律.寒露
七律新诗.寒露寒露罗欣然乌丝浅雾尚如画，竹色潇潇子规啼...
琉璃盏中颜如玉阅读 583评论 0赞 3

赞1赞

赞赏

手机看全文