python实战计划第一周，第二个项目

爬取商品信息

import requests
from bs4 import BeautifulSoup
import os

os.chdir('/Users/baidu/Desktop/爬虫/Plan-for-combating-master/week1/1_2/1_2answer_of_homework/1_2_homework_required/')

with open('index.html', 'r') as wb_data:
    soup = BeautifulSoup(wb_data, 'lxml')

    images = soup.find_all('div', {'class': 'thumbnail'})
    prices = soup.find_all('h4', {'class': 'pull-right'})
    titles = soup.find_all('div', {'class': 'caption'})
    reviews = soup.find_all('div', {'class': 'ratings'})
    stars = soup.find_all('div', {'class': 'ratings'})

for image, price, title, review, star in zip(images, prices, titles, reviews, stars):
    star_num = len(star.find_all('p')[1].find_all('span', {'class': 'glyphicon glyphicon-star'}))
    data = {
    'image': image.img['src'],
    'price': price.get_text(),
    'title': title.a.get_text(),
    'review': review.p.get_text().split(' ')[0],
    'star': str(star_num) + '星'
    }
    print(data)

最后编辑于：2017.12.03 05:32:44

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

赞1赞

赞赏

手机看全文

python实战计划第一周，第二个项目

相关阅读更多精彩内容

友情链接更多精彩内容