今天想复习下BeautifulSoup,就把之前的代码拿过来测试,发现报错了
import urllib
from bs4 import BeautifulSoup
#加载网址,获取当前页面
def getHTML(url) :
page = urllib.urlopen(url)
html = page.read()
return html
html = getHTML('https://movie.douban.com/top250')
soup = BeautifulSoup(html, "html.parser")
for img in soup.find_all('img'):
print(img.get('src'))
查了下,发下是Python3中,需要引入的模块变了
改一下就可以了
urllib.request.urlopen(url)