Week1-2

Week1-2 的代码


from bs4 import BeautifulSoup

with open('C://personal/study/Python/Plan-for-combating-master/Plan-for-combating-master/week1/1_2/1_2answer_of_homework/index.html','r') as wb_data:

Soup = BeautifulSoup(wb_data,'lxml')

images = Soup.select("body > div > div > div.col-md-9 > div > div > div > img")

titles = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')

prices = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')

reviews = Soup.select("body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right")

stars = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p > span')

#    print(images,titles,prices,reviews,stars,sep='\n-----------------\n')

for image,title,price,review,star in zip(images,titles,prices,reviews,stars):

data = {

'title':title.get_text(),

'image':image.get('src'),

'price':price.get_text(),

'review':review.get_text(),

'star':len(star.find_all('span','glyphicon glyphicon-star'))

}

print(data)


输出如下,star 都是0,请老师点评。

{'image': 'img/pic_0000_073a9256d9624c92a05dc680fc28865f.jpg', 'review': '65 reviews', 'price': '$24.99', 'title': 'EarPod', 'star': 0}

{'image': 'img/pic_0005_828148335519990171_c234285520ff.jpg', 'review': '12 reviews', 'price': '$64.99', 'title': 'New Pocket', 'star': 0}

{'image': 'img/pic_0006_949802399717918904_339a16e02268.jpg', 'review': '31 reviews', 'price': '$74.99', 'title': 'New sunglasses', 'star': 0}

{'image': 'img/pic_0008_975641865984412951_ade7a767cfc8.jpg', 'review': '6 reviews', 'price': '$84.99', 'title': 'Art Cup', 'star': 0}

{'image': 'img/pic_0001_160243060888837960_1c3bcd26f5fe.jpg', 'review': '18 reviews', 'price': '$94.99', 'title': 'iphone gamepad', 'star': 0}

{'image': 'img/pic_0002_556261037783915561_bf22b24b9e4e.jpg', 'review': '18 reviews', 'price': '$214.5', 'title': 'Best Bed', 'star': 0}

{'image': 'img/pic_0011_1032030741401174813_4e43d182fce7.jpg', 'review': '35 reviews', 'price': '$500', 'title': 'iWatch', 'star': 0}

{'image': 'img/pic_0010_1027323963916688311_09cc2d7648d9.jpg', 'review': '8 reviews', 'price': '$15.5', 'title': 'Park tickets', 'star': 0}

Process finished with exit code 0

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • python实战计划1_2 视频总共看了好几遍才看懂,BeautifulSoup文档也看了好几遍,总算做出来了。 ...
    Alexhan1989阅读 232评论 0 0
  • 程序部分: def bubble_sort(data): #冒泡排序 for i in range(0,len(d...
    翀Chen翀阅读 264评论 0 0
  • frombs4importBeautifulSoup xjd1=[] withopen('index.html',...
    xilixjd阅读 207评论 0 0
  • python实战计划的第二个项目:爬取商品信息。 最终结果如下: 共八件商品,每件商品包括5项信息,分别是:图片地...
    乐小Pi孩_VoV阅读 328评论 0 0
  • 标签(空格分隔): java 面试 特性(本文依照 小楠总的简书进行写作) Java 1.5新特性 静态导入for...
    六花垂冰丸阅读 253评论 0 0