实例3:百度、360搜素关键词提交
问题:可不可以向百度或者260提交问题,来搜素结果
搜素引擎关键字接口:
百度关键词接口:
http://www.baidu.com/s?wd=keyword
360的关键词接口:
http://www.so.com/s?q=keyword
2,所以对于requests库来讲,只要构造这样的url就可以实现这样的提取
>>>import requests
>>>kv = {'wd' : 'Python'} # 键值对 'wd'是搜索引擎的接口前的标识,Python是我们的关键值
>>>r = requests.get("http://www.baidu.com/s,"params = kv) #params可以向URL中增加相关内容
>>>r.status_code
200
>>>r.request.url #发给百度的request对应的URL
>>>len(r.text)
3400061 #先不要打印反馈的信息,看看信息长度,340061这是340k的信息(解析反馈内容分,下周见)
百度全代码:
注意:
360全代码和百度全代码的区别是:keyword前边的不同,如上图。
实例四:网络图片的爬取和储存
网络图片的爬取(利用代码保存图片)
网络图片链接的格式:
http://www.example.com/picture.jpg
比如找:国家地理:
http://www.nationalgeographic.com.cn/(从国家地理里选取图片)
选择一个图片的web页面地址:
http://img1.gtimg.com/news/pics/19345/19345304.jpg
爬取文件的全代码:
'http://www.baidu.com/s?wd=Python'