from bs4 import BeautifulSoup
with open('./1_2_homework_required/index.html', 'r') as f:
soup = BeautifulSoup(f, 'lxml')
pics = soup.select('div.col-md-9 > div > div > div > img')
titles = soup.select('h4 a')
prices = soup.select('h4.pull-right')
views = soup.select('div.ratings p.pull-right')
starts = soup.select('div.ratings > p:nth-of-type(2)')
for pic, title, price, view, start in zip(pics, titles, prices, views, starts):
data = {
# 注意不要丢掉前面pic title 等键的引号
'pic': pic.get('src'),
'title': title.get_text(),
'price': price.get_text(),
'view': view.get_text(),
#find_all(name, attrs, recursive, text, **kwargs)
# names:标签名字;attrs:标签属性
'start': len(start.find_all('span','glyphicon glyphicon-star'))
}
print(data)
第一周第二课时
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 训练内容:有氧动力跑+抗乳酸跑,配速:7'02''/6'24'',持续时间:40:00/5'23''训练小结: 实...