Kotlin编程技巧:正则表达式
我们程序员在编程过程中,经常会用到正则表达式,本期呢,我们就用Kotlin这门语言作为例子,来说一下正则表达式的运用。
正则表达式当中有一个非常重要的概念,就是模式。模式是我们做字符串操作时候的依据。模式可以是具体的某些字符,也可以是一些特定的转义符。比如\s表示搜索空格。
特殊字符必须用双斜杠,或者我们可以用Kotlin自带的原始字符串。
在定义好模式以后,我们可以用下面的函数来进行操作matches, containsMatchIn, find, finaAll, replace和split。
下面是一些通用的正则表达式的转移符。这些转义符基本上能够满足我们日常的编程工作需求。
. 表示可以匹配任何单个的字符。
? 表示可以匹配一个或者0个前置元素。
+ 表示可以匹配一个或多个前置元素。
* 表示可以匹配零个或多个前置元素。
^ 表示的是在字符串中的起始位置。
$ 表示的是字符串中的终止位置。
| 表示的是轮换运算符。
[abc] 表示匹配a或者b或者c。
[a-c]表示匹配a或者b或者c。
[^abc]表示否定,匹配任何除了a或者b或者c以外的元素。
\s 表示匹配空格符。
\w 表示匹配一个字符。跟这个相等[a-zA-Z_0-9]。
1. 先说一下方法实例。大体有匹配,查找和拆分。
全集匹配和子集匹配。
matches用来做全集匹配。
containsMatchIn用来做子集匹配。
如我们定一个模式test, 全集匹配的情况下只有test为真, 子集匹配的情况下,只要包含test,就为真,比如这些字符串atest, testb,ctestc。
查找。
find用来查找元素,返回找到的第1个元素的索引。
findAll用来查找所有的元素, 返回一个序列,其中包含元素值及其对应的索引。
拆分。
split用来拆分一个字符串, 返回一个字符串数组。
2. 说一下模式实例。
2.1 可以设定大小写不敏感。
构建模式toRegex时, 放入IGNORE_CASE就可以。
2.2 点通配符表示任何单个的字符。
val pattern = "..test".toRegex()
对于这个模式来说,下面的字符串都是可以匹配的。
cdtest, abtest.
2.3 问号通配符表示元素可以出现零次或者一次。
val pattern = ".?test".toRegex()
对于这个模式来说,下面的字符串都是可以匹配的。
atest, abtest.
2.4 数量修饰符{n,m}表示最少出现n次,最多出现m次。
val pattern = "\\w{3,4}".toRegex()
上面这个模式表示最少有3个字符,最多有4个字符。
2.5 起始和终止
val pattern = "^Test".toRegex() 表示查看是否字符串是由Test起始的。
val pattern = "$Test".toRegex() 表示查看是否字符串是由Test终止的。
2.6 或运算符。
或运算符用来表示任何情况之一即可满足条件。
val pattern = "Test|Alpha|Beta".toRegex()
2.7 模式嵌套。
模式嵌套是指一个模式中存在另外一个子模式。
val pattern = "Test(Alpha|Beta|Production)?".toRegex()
2.8 字符类。
字符类用来定义一组字符集。字符类的元素出现任何之一即可满足条件。
val pattern = "t[es]t".toRegex()
2.9 内定的字符类,可以用简化的名字来表示。
下面是一些已经内定的字字符类。
\s 表示任意空字符,相当于[\t\n\t\f\v]。
\d 表示任意数字, 相当于[0-9]。
\w 表示任意字符,相当于[a-zA-Z0-9_]。
2.10 匹配组合。匹配组合是用括号来把多个模式放在一起作为一个单一的模式。比如(test)就包含了四个模式: t e s t。
这里是丁哥开讲,我们这一期就谈这些吧,如果你有什么想法和观点请给我留言,我们下次再见,谢谢。