盗字笔记(10)

实例3:百度、360搜素关键词提交

问题:可不可以向百度或者260提交问题,来搜素结果

搜素引擎关键字接口:

百度关键词接口:

http://www.baidu.com/s?wd=keyword

360的关键词接口:

http://www.so.com/s?q=keyword

2,所以对于requests库来讲,只要构造这样的url就可以实现这样的提取

百度搜索关键词提交

>>>import requests

>>>kv = {'wd' : 'Python'} # 键值对 'wd'是搜索引擎的接口前的标识,Python是我们的关键值

>>>r = requests.get("http://www.baidu.com/s,"params = kv)  #params可以向URL中增加相关内容

>>>r.status_code

200

>>>r.request.url  #发给百度的request对应的URL

>>>len(r.text)

3400061 #先不要打印反馈的信息,看看信息长度,340061这是340k的信息(解析反馈内容分,下周见)

百度全代码:

本练习中的百度全代码
360全代码

注意:

360全代码和百度全代码的区别是:keyword前边的不同,如上图。

实例四:网络图片的爬取和储存

网络图片的爬取(利用代码保存图片)

网络图片链接的格式:

http://www.example.com/picture.jpg

比如找:国家地理:

http://www.nationalgeographic.com.cn/(从国家地理里选取图片)

选择一个图片的web页面地址:

http://img1.gtimg.com/news/pics/19345/19345304.jpg

爬取图片
在D盘的显示(写入D盘里)

爬取文件的全代码:

爬取图片的全代码


'http://www.baidu.com/s?wd=Python'

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,228评论 19 139
  • 春节假期过去了,收收心我们来开始继续学习Zookeeper的其他相关知识.今天要说的是 Zookeeper Jav...
    小辉0829阅读 4,470评论 0 1
  • 记我旅行中住过的民宿 经常到处走走看看的我去过很多地方游荡~~~无论是五星酒店还是三星酒店甚至是地下室,统统都住过...
    吃货玩咖旅行记阅读 2,383评论 0 2
  • 自从大学尤其是上班以后走上了只会电脑和手机这条路,加上孕傻以及带娃的心酸就彻底与书籍说再见了。 说说最近想说的吧,...
    理理天天胡阅读 1,607评论 0 0
  • 标题: 为什么你那么优秀还是会遇到渣男? 如何拥有赵雅芝的不老容颜? 没事业没爱情,30岁生活依然精彩。 保温水杯...
    王天露阅读 1,513评论 0 0

友情链接更多精彩内容