自学Python爬虫:实现解码

Python 的标准库urllib.parse模块中用 urlencode编码后的内容想要解码,可以使用对应的unquote() 方法。该方法将编码后的 url 地址进行还原,被称为解码。
下面示例上篇编码的内容解码,代码如下:

from urllib import parse
string = '%E7%88%AC%E8%99%AB'
result = parse.unquote(string)
print(result)

执行结果如下:
爬虫

from urllib import parse
string = '%E8%87%AA%E5%AD%A6%E7%88%AC%E8%99%AB'
result = parse.unquote(string)
print(result)

执行结果如下:
自学爬虫

对于百度搜索后出现的看不懂的编码,也可以使用这个方法解码。把机器看懂的内容变成能看懂的内容。有点反向解密的味道。
老铁,你学会了吗?
________________END______________

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容