用代码请求jianshu网站

代码如下所示：

import urllib.parse

import urllib.request

url = 'https://www.jianshu.com'

headers = {'User-Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'}

req = urllib.request.Request(url=url, headers=headers)

response = urllib.request.urlopen(req)

print(response.read().decode('utf-8'))

由于采用了反爬措施，需要先构造请求头才可以请求该网站。输出信息既是网站的源代码。还可以使用更加方便的add_header()方法添加请求头。例如下面这样：

req = urllib.request.Request(url=url) # 创建Request实例

req.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)') # 这里不是字典

Python爬虫urllib2库的基本使用系列(三)
1. 网页抓取所谓网页抓取，就是把URL地址中指定的网络资源从网络流中抓取出来。在Python中有很多库可以用来...
rhlp阅读 995评论 0赞 0
urllib的用法
什么是Urllib： Urllib是python内置的HTTP请求库包括以下模块 urllib.request ...
啊烟雨阅读 1,309评论 0赞 5
urllib vs urllib2 vs requests
urllib and urllib2 区别 –博主提示：下面的是python2中的用法，python3需要做出相应...
sunnyRube阅读 1,443评论 0赞 1
View事件分发（二） - 事件分发机制一（理论分析）
1. 概述这篇文章记录下，事件分发机制，该机制对后边的自定义View和处理View滑动冲突很有帮助。这...
世道无情阅读 804评论 1赞 13
对照参学49
【日文】疾風に勁草を知る (しっぷうにけいそうをしる) 【中文】疾风知劲草【感悟】人与人的不同，在苦难、...
行禅者阅读 359评论 0赞 0

赞1赞

赞赏

手机看全文