2023-08-04扒网易评论

思路1:从后往前写

最后一句: 如果怎么样就调用主函数


user-agent的拷贝方法(以下为随意拷贝)

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.188


不要直接打开 可能太多直接卡死 转成一个文本文件 把返回的资源的对应文本写进去


2找到、下载目标文件

把url资源直接下载下来没有用 并没有评论

一个网页并非有一个源文件构成 而是由许多小文件构成

让浏览器以很慢的速度加载网页,在出现评论的时候停止加载同时暂停录制,以此筛选出文件

disable cache禁止缓存

调网页的载入速度

清楚已加载的 然后开启录制

看文件类型缩小范围 doc xhr都可以传递文本

空白界面是因为post

从服务器上获取数据有很多种方法 

get 直接获取内容 参数都在查询字符串里边

post则需要提交一个指定的data 服务器才会给你数据

requests模块允许将两个参数以字典的形式传进去 键值同名即可

以等号为第零个元素的标志进行分割 第一个元素就是这首歌的id


3提取关键数据

hot comments是一个列表 所以用迭代的形式获取每一个元素 将指定的东西打印出来

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 背景 平时使用的是163邮箱,会经常需要收一些邮件,在电脑旁边的时候还好,PC的网易邮箱使用起来很是很简易的,完成...
    颈椎以上瘫痪阅读 6,399评论 0 0
  • 前端开发面试题 <a name='preface'>前言</a> 只看问题点这里 看全部问题和答案点这里 本文由我...
    自you是敏感词阅读 4,274评论 0 3
  • 云控日志CloudLog,帮助您实现电脑、手机、嵌入式系统等不同平台的日志管理统一化。通过CloudLog,您可以...
    Cc812487000阅读 571评论 0 0
  • 什么是 FOUC(无样式内容闪烁)?你如何来避免 FOUC? FOUC - Flash Of Unstyled ...
    MrThorn阅读 3,287评论 0 1
  • <a name='html'>HTML</a> Doctype作用?标准模式与兼容模式各有什么区别? (1)、<...
    clark124阅读 9,037评论 1 19

友情链接更多精彩内容