用正则表达式实现window.location的对象

URL格式

protocol :// hostname[:port] / path / [;parameters][?query]#fragment

代码

// URL地址匹配格式: protocol :// hostname[:port] / path / [;parameters][?query]#fragment
// [;parameters]:这都没见过这东西,就不匹配了。
let url = [
    'https://www.baidu.com/',
    'http://192.168.1.1',
    'http://192.168.1.1:8080',
    'https://news.163.com/18/1224/15/E3Q6EJDA0001875N.html#top',
    'https://baidu.com:80/?wd=wq&url=ksks#ddsx2',
    'http://192.168.1.1/p/#name',
    'https://neets.cc/subcriberlist?recommendInventoryId=QNZfMjCRQtS4z8MQrFa7qo'
]
, result = null
, reg= /^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(\?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i
, info = ['完整URL', '协议', '域名', '端口号', '路径', '查询', 'hash']
url.forEach((value) => {
    result =value.match(reg)
    console.log('---------------------------------------------------------------------------------');
    for (let i = 0; i < result.length; i++) {
        console.log(`${info[i]} = ${result[i]}`);
    }
})

运行截图

image.png

元字符解释

元字符 匹配对象
. 任意一个字符
[...] 字符组 字符组内的任意一个字符
[^...] 排除字符组 排除字符组内的所有字符
\char 转义符 转义元字符 或 反引用
提供计数功能的元字符
+ 加号 至少一次
? 问号 匹配一次,但非必须的
* 星号 0次或多次,但非必须的
其它元字符
(...) 括号 限定或界定符,也用于反引用

协议匹配规则

常见URL协议有http、https等等,所以这里就做针对http和https的匹配。
匹配规则 :^(https?://)

主机名匹配规则

主机名格式为:xxx.xxx.xxxxxx.xxx 2种形式 由字母或数字组成。如:www.baidu.com baidu.com 127.0.0.1
匹配规则为:([0-9a-zA-z.]+)

端口匹配

端口部分是由冒号开头后接数值两部分组成而且web默认端口80是不显示在后面的,所以就有2种情况存在或不存在。
如:127.0.0.1:8080 127.0.0.0
匹配规则为:(:[0-9]+)?

路径匹配

路径是由字母、数字、斜杠、点组成。在访问网站首页时后面没有路径地址,所以这块如果存在就匹配。
如:/xxx/xxxx/xxx.html 、 /xxx/xxx
匹配规则为:([/0-9a-zA-Z.]+)?

查询字符串匹配

查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(?[0-9a-zA-Z&=]+)?

信息片断匹配

信息片断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(#[0-9-a-zA-Z]+)?

参考链接:

js正则表达式 URL格式匹配详解

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1,正则表达式的作用:匹配一个字符串中的一些内容 2,声明和使用: 1)构造函数 var reg=new RegE...
    WDL_1a39阅读 866评论 0 1
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,292评论 0 9
  • 匹配中文:[\u4e00-\u9fa5] 英文字母:[a-zA-Z] 数字:[0-9] 匹配空格:[ ]匹配连续空...
    joker_fu阅读 4,331评论 0 0
  • 元字符 \b 代表着单词的开头或结尾,也就是单词的分界处。虽然通常英文的单词是有空格,标点符号挥着换行来分割的,但...
    onzing阅读 692评论 0 0
  • 忘了从哪收集的资料了,放这儿,以备不时之需。 只能输入数字:"^[0-9]*$"。 只能输入n位的数字:"^\d{...
    study_monkey阅读 1,488评论 0 7

友情链接更多精彩内容