爬虫--豆瓣电影(励志分类区)

import requests
import time
from lxml import etree

for a in range(3):
    url = 'https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=&start={}'.format(a*20)
    file = requests.get(url).json()
    time.sleep(3)
    
    for i in range(20):
        dict = file['data'][i]
        urlname = dict['url']
        title = dict['title']
        rate = dict['rate']
        cast = dict['casts']
        
        print('{} {} {} {}\n'.format(title,rate,' '.join(cast),urlname))
  • 输出情况如图(截取部分数据)


    加载部分图书信息
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,327评论 25 709
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,385评论 19 139
  • 这几天学校的一切工作,无不说明“人心齐,泰山移”的道理,无论领导,还是老师无不在践行着“学校是我的家,我是学校的一...
    l映日荷花阅读 3,982评论 0 7
  • 搜索ESL的时候不经意看到了简书,内容不错,还可以偶尔尝试自己写写。有曾经发现天涯和知乎的欣喜。书海无涯,此生又多一城!
    简书richard阅读 968评论 0 0
  • 2018年1月9日 星期二 小雪 我是日记星球348号星宝宝石明秀,我在参加日记星球第十三期21天蜕变之...
    妞妞姐S阅读 3,582评论 9 23