使用python的requests+lxml 库爬取Bing的首页背景图

import requests

    from lxml import etree

    import datetime

    #导入需要的函数库

    url = 'https://cn.bing.com'

    #获取URL

    headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81 FS'


    } 

    #添加头部信息,增加爬取成功的概率

    response = requests.get(url, headers=headers).text

    #.text 来获取文本信息

    html = etree.HTML(response)


    imgUrl = url + html.xpath('//*[@id="bgLink"]/@href')[0]

    #使用XPATH对网页进行解析,获取图片的URL。解析出来的数据是列表形式,所以使用[0]来得到想要的东西。


    img = requests.get(imgUrl).content

    #.content 来获取图像和文件信息

    now = datetime.datetime.now()

    #获取当前时间

    str_time = datetime.datetime.strftime(now, '%Y-%m-%d')

    #strftime()函数把时间转换成字符串形式

    path = 'D:/{}.jpg'.format(str_time)

    #图片保存路径,并用当前时间作为图片名称

    with open(path, 'wb') as f:

        f.write(img)

    #'wb'以二进制方式写入图片

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容