爬取小米ROM

from urllib.request import urlopen

import re

from bs4 import BeautifulSoup

f = open('News_MIUIROM.txt','w',encoding='utf-8') #打印ROM版本到News_MIUIROM.txt文档

j = 330

#获取URL方法

def get_url():

    url = 'http://www.miui.com/download-'+str(j+x)+'.html'

    return url

#获取ROM信息方法

def get_romnews():

    html = urlopen(get_url())  # 访问小米ROM网址

    content = html.read().decode('utf-8')  #以utf-8 字节码编译 网页信息

    content = BeautifulSoup(content, 'html.parser') #bs4对网页编码进行整理

    content = content.find_all("a", class_="route_a d2r") #获取ROM信息

    content = str(content)  #转化成字符串

    Rom_download = re.search('http(.*?)zip',content).group(0) #使用正则表达式截取ROM下载地址

    print(Rom_download)

    Rom_version= re.search('m/(.*?)/m',Rom_download).group(1) #获取ROM版本信息

    print(Rom_version)

    return Rom_download,Rom_version

#循环写入ROM信息

for x in range(0,10):

    try:

        a ,b = get_romnews()

    except AttributeError:

        print('无此网页')  #异常处理

        continue

    else:

        f.write('ROM下载地址:' + a + '\n')

        f.write('ROM版本信息:' + b + '\n')

f.close()

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 9,724评论 4 16
  • 声明:本文讲解的实战内容,均仅用于学习交流,请勿用于任何商业用途! 一、前言 强烈建议:请在电脑的陪同下,阅读本文...
    Bruce_Szh阅读 14,392评论 6 28
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,224评论 19 139
  • "use strict";function _classCallCheck(e,t){if(!(e instanc...
    久些阅读 6,225评论 0 2
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 11,924评论 0 17

友情链接更多精彩内容