Python入门学习(14)

利用Python实现翻墙——下载网址

今天作业

图片发自简书App

我完成的图

图片发自简书App

今天的代码很多看不懂,幸亏群里有大神,参考 TianAff 和 sinkpink 的笔记才有一点思路。

1、urllib模块提供上层接口,可以像读取本地文件一样读取www和ftp上的数据。(我试试,发现只需两行代码就能抓取百度首页的html)

图片发自简书App

2、re模块。经python大大解析,作业中re是过滤网页的html符号,只显示我们关注的文字

3、利用urlretrieve()函数将远程信息下载到本地

4、re.sub()中re是regular expression的缩写,表示正则表达式。正则表达式通常被用来检索、替换符合某个模式的文本(不太懂!!!)

5、"* ?"的组合是非贪婪模式(还是不懂!!!)

6、join()函数表示连接字符串,常常用于字符连接操作

图片发自简书App

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 个人笔记,方便自己查阅使用 Py.LangSpec.Contents Refs Built-in Closure ...
    freenik阅读 67,777评论 0 5
  • python学习笔记 声明:学习笔记主要是根据廖雪峰官方网站python学习学习的,另外根据自己平时的积累进行修正...
    renyangfar阅读 3,092评论 0 10
  • http://python.jobbole.com/85231/ 关于专业技能写完项目接着写写一名3年工作经验的J...
    燕京博士阅读 7,629评论 1 118
  • 《Model-based Deep Hand Pose Estimation》X Zhou, Q Wan, W Z...
    hzyido阅读 505评论 0 0
  • 昨天没更文,有点焦虑,这几天在想一个问题:最近好像对自己的健康越来越不自信了。 事情从周日说起,那天应朋友之邀到银...
    绚烂秋叶阅读 301评论 1 1