jQuery学习笔记(正则)

jQuery中使用了大量的正则表达式,这些正则汇聚了作者的智慧,值得细心琢磨.

url 分割

下面这个正则用来解析url,使用它可以获取url中的各个部分(protocol,host,port)

rurl = /^([\w.+-]+:)(?:\/\/([ ^\/?#:]*)(?::(\d+)|)|)/

涉及的知识点:

  • ^匹配一个输入或一行的开头, 例如/^a/匹配"an" 不匹配"An",如果设置了Multiline属性,也匹配“\n”或“\r”之后的位置.出现在中括号时,匹配未包含其之后的任意字符,例如[^xyz]表示不匹配xyz

  • 分组分为捕获性分组和非捕获性分组,捕获分组会存储匹配的内容,以便下次使用,非捕获性分组不存储匹配的内容,以(?:...)表示

  • [\w.+-]protocol包含字母数字,.+-这几类字符,并且是以字母开头,参考URI .+都是特殊字符,为什么不转义呢?[\w.+-]奇怪的是chrome下面测试[\w.+-]和[\w.+-]是等价的?‍

  • |选择符,rurl中选择符的使用有点奇怪,/x|/的意思是匹配x或者空字符串/(x)|()/.exec('a') -> ["",undefined, ""];

跨域

很多文章都在讲跨域,到底什么是跨域呢,看看ajax中是如何判断跨域的

if ( s.crossDomain == null ) {
    parts = rurl.exec( s.url.toLowerCase() ); //使用rurl切割用户请求的
    urls.crossDomain = !!( parts &&          //ajaxLocParts是当前页面的
         ( parts[ 1 ] !== ajaxLocParts[ 1 ] || parts[ 2 ] !== ajaxLocParts[ 2 ] ||
         ( parts[ 3 ] || ( parts[ 1 ] === "http:" ? "80" : "443" ) ) !==
         ( ajaxLocParts[ 3 ] || ( ajaxLocParts[ 1 ] === "http:" ? "80" : "443" ) ) )
    );
}
  • 协议不同
  • 域名不同
  • 端口不同

请求加时间戳,禁止浏览器缓存

function addDateStamp( url ){
    var rts = /([?&])_=[ ^&]*/
    return rts.test( url) ?

    // If there is already a '_' parameter, set its value
    url.replace( rts, "$1_=" + new Date().getTime() ) :  // Otherwise add one to the end
    url + ( /\?/.test( url ) ? "&" : "?" ) + "_=" + new Date().getTime();
}

/%20/

jquery工具函数$.param用于对象序化

例如$.param({a : ' '}) -> a=+, 为什么结果是a=+而不是a=空格?

因为$.param方法内部使用encodeURIComponent对字符进行编码,空格经过编码是%20,然后使用str.replace( /%20/g , "+" )替换%20.

为什么要将空格变为加号呢?

w3c中关于 Form content types中要求浏览器必须实现 application/x-www-form-urlencoded 和 multipart/form-data编码规范,二前者明确规定 Space characters are replaced by `+'

下面是一些网络参考:

一个题外话,我们知道http response有一个contentType响应头,http request 也可以设置contentType,你知道吗?有什么作用呢?

response header的contentType是告诉浏览器,服务器回传的数据是什么类型,浏览器要如何处理。

request header 的contentType自然就是告诉服务器,浏览器传给你的时什么数据,你应该如何去解码处理等等。

jquery 中ajax也是会默认设置request 的contentType header,

1.7.2版本之前的值是application/x-www-form-urlencoded,之后的版本加上了charset=UTF-8。

对于使用ajax传递中文的情况,在使用1.7.2之前的版本会出现中文乱码的情况。处理的方案也很简单,就是覆盖原先的contentType,使用contentType=application/x-www-form-urlencoded;charset=UTF-8。

替换函数参数问题

str.replace(ExpReg , replacementFn )

替换函数的第一个参数代表的是正则的匹配结果,之后的参数对应的是正则中的分组,_1 代表的就是第一个分组(a)的匹配结果。

var regExp = /(a)(b)(c)/;
function replacement( _, _1, _2, _3 ){
    return _3 + _2 + _1 ;
}
console.log('abc'.replace(regExp,replacement));  // output: cba

idGetByProgram.replace( /'|\/g , "\$&" )

Sizzle函数中有一处代码,将两个特殊字符('和)添加转义字符\,为什么要做这个事情呢?

$&的值指的是正则第一个参数匹配到的结果

去除首尾空格

sizzle中有一个去除首尾空格的正则

rtrim = /^[\x20\t\r\n\f]+|((?:^|[ ^\\])(?:\\.)*)[\x20\t\r\n\f]+$/g

((?:|[\])(?:\.)*)东东是用来干什么的,是有什么特殊情况需要考虑吗?

下面的,也能够去掉首尾空格,

/^\s+|\s+$/g

jquery本身也定义了一个去除空格的正则,名字也叫rtrim,但是两个正则写法不同为什么呢?

rtrim = /^[\s\uFEFF\xA0]+|[\s\uFEFF\xA0]+$/
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,307评论 19 139
  • 第一章 入门 基本功能:访问和操作 dom 元素,控制页面样式,对页面的事件处理,与ajax完美结合,有丰富的插件...
    X_Arts阅读 4,652评论 0 2
  • 9.19--9.23 第7章 正则表达式 正则表达式是一个拆分字符串并查询相关信息的过程。 推荐练习网站: js ...
    如201608阅读 4,680评论 0 4
  • 初衷:看了很多视频、文章,最后却通通忘记了,别人的知识依旧是别人的,自己却什么都没获得。此系列文章旨在加深自己的印...
    DCbryant阅读 9,490评论 0 20
  • 今天是清明,这已经是不知道难过了多久的一天,总是担心你在另一个世界过的不好,有几次梦见我们回到了从前,你忙前忙后的...
    葵花子精灵阅读 3,610评论 0 2