python-requests模块

response.text和response.content的区别

  • response.text
    类型:str
    解码类型:requests模块自动根据http头部对响应的编码做出推测,推测返回文本的编码格式,如果使用这种方式接收,如果猜测错误会导致乱码
  • response.content
    类型:bytes
    解码类型:没有指定,我们接收到之后可以按照自己想要的方式进行转换
    例如:以下--test.py
import requests
url = 'http://www.baidu.com'
response = requests.get(url)
response.encoding = 'utf8'
print(response.text)

#第二种方式
url = 'http://www.baidu.com'
response = requests.get(url)
#不传也行,默认就是utf-8
print(response.content.decode('utf-8'))

通过对response.content进行decode,来解决中文乱码

  • response.content.decode() 默认utf-8
  • response.content.decode("gbk")
  • 常见的编码字符集
    1.utf-8
    2.gbk
    3.ascii
    4.iso-8859-1
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容