盗字笔记（10）

实例3：百度、360搜素关键词提交

问题：可不可以向百度或者260提交问题，来搜素结果

搜素引擎关键字接口：

百度关键词接口：

http://www.baidu.com/s?wd=keyword

360的关键词接口：

http://www.so.com/s?q=keyword

2，所以对于requests库来讲，只要构造这样的url就可以实现这样的提取

百度搜索关键词提交

>>>import requests

>>>kv = {'wd' : 'Python'} # 键值对 'wd'是搜索引擎的接口前的标识，Python是我们的关键值

>>>r = requests.get("http://www.baidu.com/s,"params = kv) #params可以向URL中增加相关内容

>>>r.status_code

200

>>>r.request.url #发给百度的request对应的URL

>>>len(r.text)

3400061 #先不要打印反馈的信息，看看信息长度，340061这是340k的信息（解析反馈内容分，下周见）

百度全代码：

本练习中的百度全代码

360全代码

注意：

360全代码和百度全代码的区别是：keyword前边的不同，如上图。

实例四：网络图片的爬取和储存

网络图片的爬取（利用代码保存图片）

网络图片链接的格式：

http://www.example.com/picture.jpg

比如找：国家地理：

http://www.nationalgeographic.com.cn/（从国家地理里选取图片）

选择一个图片的web页面地址：

http://img1.gtimg.com/news/pics/19345/19345304.jpg

爬取图片

在D盘的显示（写入D盘里）

爬取文件的全代码：

爬取图片的全代码

'http://www.baidu.com/s?wd=Python'

最后编辑于：2018.05.07 21:14:53

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。