第一周第二课时

程序运行结果
from bs4 import BeautifulSoup
with open('./1_2_homework_required/index.html', 'r') as f:
    soup = BeautifulSoup(f, 'lxml')
    pics = soup.select('div.col-md-9 > div > div > div > img')
    titles = soup.select('h4 a')
    prices = soup.select('h4.pull-right')
    views = soup.select('div.ratings p.pull-right')
    starts = soup.select('div.ratings > p:nth-of-type(2)')
for pic, title, price, view, start in zip(pics, titles, prices, views,  starts):
    data = {
        # 注意不要丢掉前面pic title 等键的引号
        'pic': pic.get('src'),
        'title': title.get_text(),
        'price': price.get_text(),
        'view': view.get_text(),
        #find_all(name, attrs, recursive, text, **kwargs)
        # names:标签名字;attrs:标签属性
        'start': len(start.find_all('span','glyphicon glyphicon-star'))
    }
    print(data)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 训练内容:有氧动力跑+抗乳酸跑,配速:7'02''/6'24'',持续时间:40:00/5'23''训练小结: 实...
    podrunner阅读 500评论 0 1
  • 记忆深处落满金色的叶语 秋天已远 我们的心 却无法从果实的光芒中移离 2016.1...
    雪濯阅读 269评论 0 1
  • 排球第一场 打影视落幕了。 很高兴影视派了一支拉拉队。 早早结束比赛。 还能看看男排打球。(超帅) 一年只和我说一...
    反正我们也不赶时间阅读 306评论 0 0
  • 1.输出语句:document.write(""); 2.JS中的注释为//3.传统的HTML文档顺序是:docu...
    懵逼js阅读 1,241评论 2 41
  • 17/30 还未感觉到 风凛冽地刮过 树上的枯叶 就不见了踪影 带哨的鸽子 从露台飞出 画出 足球场大的一个弧 又...
    柴子恒阅读 249评论 2 1