Python-正则表达式

import re
import requests
from fake_useragent import UserAgent

ua = UserAgent()
headers = {'User-Agent': ua.random}

html = requests.get('http://www.baidu.com/',headers = headers)
html.encoding = 'utf-8'
html = html.text
title = re.findall(r'<a href="(http://.*?.com)" name="tj_tr.*?" class="mnav">(\w{2})</a>',html)
print(title)

输出

[('http://news.baidu.com', '新闻'), ('http://map.baidu.com', '地图'), ('http://v.baidu.com', '视频'), ('http://tieba.baidu.com', '贴吧'), ('http://xueshu.baidu.com', '学术')]

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Python 正则表达式——re模块介绍
Python 正则表达式 re 模块使 Python 语言拥有全部的正则表达式功能，re模块常用方法： re.ma...
小天真_5eeb阅读 2,031评论 0赞 10
Python正则表达式用法详解
搞懂Python 正则表达式用法 Python 正则表达式正则表达式是一个特殊的字符序列，它能帮助你方便的检查一...
厦热阅读 1,821评论 0赞 2

Python正则表达式-为什么要用原始字符串
本文为《爬着学Python》系列第六篇文章。本文也算是系列教程的第二篇不规则更新。在讨论Python正则表达式之...
SyPy阅读 4,642评论 0赞 7
比相爱更重要的
“这日子没法过了。”刚接通电话，那边利的咆哮便如洪水般倾泻而出，这端的我耳膜都被震得嗡嗡响，“每天出去喝喝喝，那些...
谢意阅读 490评论 7赞 9
《奇迹男孩》电影观后感
电影开始了！咦？怎么是一个在床上开心的跳来跳去的戴宇航员头盔的小男孩？书上明明说主人公Auggie脸部畸形，为什么...
抽风一刻阅读 1,287评论 0赞 1

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文