urlparse模块

python 支持两种不同的模块,两者以不同的功能和兼容性来处理URL。一种是urlparse,另外一种是urllib。
urlparse 模块用于处理一些基本功能,用于处理URL字符串,这些功能包括urlparse(),urlunparse()和urljoin()。
urlparse()将URL字符串解析为一些url组建。语法如下

 urlparse (urlstr,defProtSch = none,allowFrag=None)

urlparse()将url解析为6个元组(prot_sch,net_loc,path,params,query,frag)

例如:urlparse.urlparse('http://www.python.org/doc/FAQ.html')
     ('http','www.python.org','/doc/FAQ.html','','','')

urlparse.urlunparse()
urlunparse()的功能与urlpase()完全相反,作用是把经过urlparse()处理的6个元组拼接成一个完整的url返回
urlparse.urljoin()在需要处理多个相关的URL时我们需要用到urljoin()的功能,例如一个页面可能会产生一系列页面url。urljoin的语法为

 urljoin(baseurl, newurl, allowFrag=None)

urljoin()取得根域名,并将其根路径(net_loc及前边完整路径,但是不包括末端的文件)与newurl连接起来

 urlparse.urljoin('http://www.python.org/doc/FAQ.html','current/lib/lib.html')

'http://www.python.org/doc/current/lib/lib.html'

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Python 资源大全中文版 awesome-python[https://github.com/vinta/aw...
    万色星辰阅读 9,807评论 0 255
  • GitHub 上有一个 Awesome - XXX 系列的资源整理,资源非常丰富,涉及面非常广。awesome-p...
    若与阅读 18,744评论 4 418
  • 环境管理管理Python版本和环境的工具。p–非常简单的交互式python版本管理工具。pyenv–简单的Pyth...
    MrHamster阅读 3,850评论 1 61
  • 前言 Python的创始人为Guido van Rossum。1989年圣诞节期间,在阿姆斯特丹,Guido为了打...
    依依玖玥阅读 3,602评论 6 37
  • “杨基禄你过来一下。”杨基禄走到石梯口终于还是被人叫住,他回过头来看到李燕正含笑看着他,就好像慈爱的母亲正温柔地盯...
    初鸣歇四阅读 482评论 0 0