from bs4 import BeautifulSoup
with open('D:\\Python\\crawler\\网易云课堂作业\\第一周作业\\1_2\\1_2_homework_required\\index.html','r') as wb_data:
soup=BeautifulSoup(wb_data,'lxml')
images=soup.select('body > div > div > div.col-md-9 > div > div > div[class="thumbnail"] > img')
titles=soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a[href="#"]')
prices=soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
reviews=soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')
stars=soup.find_all('p',class_=None)
allStars=[]
num=0
for i in stars:
x=i.find_all()
if x!=[]:
for m in x:
if m.get('class')==['glyphicon', 'glyphicon-star']:
num+=1
allStars.append(num)
num=0
all_data=[]
for image,title,price,review,allStar in zip(images,titles,prices,reviews,allStars):
data={
"image":image.get('href'),
"title":title.get_text(),
'price':price.get_text(),
'review':review.get_text(),
'allStar':allStar
}
all_data.append(data)
print(all_data)
Week1_Practice2
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 前言 对于自己而言,大学4年马上结束,玩了3年半,在快毕业的时候才发觉#¥@*&……,我真是日了狗了。可惜没有时光...
- 越读营2017.7.3【2K5E每日一练】之 “SMART”汇总版 参与人数:3 参与人: @无花岛主夫人@先生辉...
- 这次作业构思到成图近5h,想了很多,感觉有些难,第四节的对落地实操的要求让我想了很多。 思考角度有三个方面...
- 电信运维为什么要转型 近几年电信行业营收情况让人担忧。一方面运营商花了大笔钱建了3G、4G网络,但是基于老的商业模...