爬取豆瓣top250的电影和电影概括

import requests
from bs4 import BeautifulSoup


def getHTML(url):
    html = requests.get(url)
    return html.text


def getInfo(list, qlist):
    cnt = 0
    flag = 0
    for i in range(10):
        turl = 'https://movie.douban.com/top250?start=' + str(i*25)
        html = getHTML(turl)
        soup = BeautifulSoup(html, 'html.parser')
        links = soup.find_all('div', class_='hd')
        for link in links:
            cnt = cnt + 1
            movie = link.a.span.text.strip()
            list.append([cnt, movie])
        quotes = soup.find_all('p', class_='quote')
        for quote in quotes:
            flag = flag + 1
            movie_quote = quote.span.text.strip()
            qlist.append(movie_quote)



def printInfo(list,qlist):
    module = "{0:^5}\t{1:{3}^20}\t{2:{3}<30}"
    print(module.format("排名", "电影名称", "一句话概括", chr(12288)))
    for i in range(1, 250):
        l_ = list[i]
        q_ = qlist[i]
        print(module.format(l_[0], l_[1], q_, chr(12288)))


def main():
    list = []
    qlist = []
    getInfo(list, qlist)
    printInfo(list, qlist)


if __name__ == '__main__':
    main()
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • “标题大法”系列分享,终极实用大招来啦~ 前两篇我们分享了“破折大法”和“告别套路”等匹配不同应用场景的标题技巧。...
    培训爱好者阅读 3,443评论 0 0
  • 静 远 真实坦然的世间行走,宁静而致远。好的担当,让人独自去看冬雨绵绵,寒意只能覆盖腠理,不能侵犯高贵的内心。...
    鱼_1177阅读 3,085评论 0 0
  • 事件:早上我8点多了才被叫起床,可胡老师说的是8点去工作室,他等我。湛师兄他和我今儿天早上3点才睡觉,所以我死,他...
    没你G阅读 3,188评论 3 5
  • 时光荏苒,一转身,雪羽飘零,又是一个冬,原本朦霾的天地间却因雪的到来变成一个童话圣境,素了万物,净了灵魂,明了苍穹...
    冯丽荧阅读 3,544评论 0 1
  • 一 跟新入职的同事聊天,她悄悄说:“姐,你可以在这里干到退休。”我哑然失笑。 姑娘刚入职,还搞不清状况,作为一家代...
    梅子Mey阅读 5,115评论 2 4

友情链接更多精彩内容