#coding=utf-8
import re,urllib2,os,urllib,requests
import webbrowser
def getHtmlCode(url):
response = urllib2.urlopen(url)
return response.read()
def getMidiUrl(htmlString):
regMidiUrl = re.compile("top-mid-title\"><a href=\"(.+?)\"")
return regMidiUrl.findall(htmlString)
def getDownloadUrl(htmlString):
regDownloadUrl = re.compile("href=\"getter(.+?)\" download>Download MIDI")
return regDownloadUrl.findall(htmlString)
def getTitleUrl(htmlString):
regTitleUrl = re.compile("<h1>(.+?)<\/h1>")
return regTitleUrl.findall(htmlString)
if __name__ == '__main__':
url = 'https://freemidi.org/topmidi'
htmlCode = getHtmlCode(url)
midis = getMidiUrl(htmlCode)
for i in range(121,len(midis)):
midiUrl = midis[i]
url2 = 'https://freemidi.org/' + midiUrl
htmlCode2 = getHtmlCode(url2)
titles = getTitleUrl(htmlCode2)
title = str(i + 1) + '.' + titles[0]
print title
downloadUrls = getDownloadUrl(htmlCode2)
downloadUrl = 'https://freemidi.org/getter' + downloadUrls[0]
print downloadUrl
chrome_path = 'open -a /Applications/Google\ Chrome.app %s'
webbrowser.get(chrome_path).open(downloadUrl)
# download
# urllib.urlretrieve(downloadUrl,"%s.mid" %("midi/" + title))
利用浏览器下载文件
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 最快速简单的实现附件(各种类型文件,doc,word,excel,ppt,pdf,MP4,MP3,apk,等等)上...
- 在用 PHP 写文件下载模块时碰到 Safari 浏览器和 IE 浏览器下载文件时, 文件名出现了乱码问题. 在返...
- How to force files to open in browser instead of download...