爬虫错题集

1. response = urllib.request.urlopen(req)获取的response对象没有.content方法

     代码如下:

     报错界面如下:

                response = urllib.request.urlopen() 所得到的这个response对象没有.content的类方法或属性。

    分析如下:

     应该使用response.read() 并且还需要解码 .decode('utf-8')

     另外在with open () 打开文件时,没有指定encoding='utf-8'

     另外,在文件保存命名上,应直接使用字符串topic,topic_url是编码后字符串,不方便辨识

     更改后代码:

        更改后执行结果:

        同级文件夹生成三个html格式文件如下:

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容