urllib.urlopen(url[,data[,proxies]])
打开一个url的方法,返回一个文件对象
urlopen返回对象提供方法
- read(),readlines(),fileno(),close():利用文件对象调用
- info():返回一个httplib.HTTPMessage对象,表示远程服务器返回的头信息
- getcode():返回Http状态码
- geturl():返回请求的url
urllib.urlretrieve(url[,filename[,reporthook[,data]]])
urlretrieve方法将url定位到的html文件下载到本地的硬盘中。若不指定filename,则存为临时文件
urlretrieve()返回一个二元组(filename,mine_hdrs)
urllib.urlcleanup()
清除由于urllib.urlretrieve()所产生的的缓存
urllib.quote(url)和urllib.quote_plus(url)
将url数据获取之后,并将其编码,从而适用与URL字符串中
urllib.unquote(url)和urllib.unquote_plus(url)
与函数4相反
urllib.urlencode(query)
将url中的键值对以连接符&划分
>>> import urllib
>>> params=urllib.urlencode({'spam':1,'eggs':2,'bacon':0})
>>> params
'eggs=2&bacon=0&spam=1'
urlopen get方式
>>> import urllib
>>> f=urllib.urlopen("http://python.org/query?%s" % params)
>>> print f.read()
urlopen post方式
>>> import urllib
>>> parmas = urllib.urlencode({'spam':1,'eggs':2,'bacon':0})
>>> f=urllib.urlopen("http://python.org/query",parmas)
>>> f.read()