正则表达式

正则表达式

正则表达式是用于操作字符串的一个规则,正则表达式的规则使用了特殊的符号表示。

一、预定义字符类

.  任何字符(与行结束符可能匹配也可能不匹配)
\d 数字:[0-9] 
\D 非数字:[^0-9] 除了0-9,其他都匹配
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]  包括a-z,A-Z,_,0-9
\W 非单词字符:[^\w]

注意:任何预定义字符没有加上数量词之前都只能匹配一个字符而已。

public class MyRegex {
    
    public static void main(String[] args) {
        System.out.println("任意字符:"+("%".matches(".")));//true
        System.out.println("数字字符:"+("1".matches("\\d")));//true
        System.out.println("非数字字符:"+("@".matches("\\D")));//true
        
        System.out.println("空白字符:"+("").matches("\\s"));//false
        System.out.println("空白字符:"+(" ").matches("\\s"));//true
        System.out.println("空白字符:"+("\r").matches("\\s"));//true
        
        System.out.println("非空白字符:"+("a").matches("\\S"));//true
        System.out.println("非空白字符:"+("\n").matches("\\S"));//false
        
        System.out.println("单词字符:"+("_").matches("\\w"));//true
        System.out.println("单词字符:"+("#").matches("\\w"));//false
        
        System.out.println("非单词字符:"+("_").matches("\\W"));//false
        System.out.println("非单词字符:"+("#").matches("\\W"));//true
        
        System.out.println("");
        System.out.println("");
        System.out.println("");
    }

}

二、数量词

X?  X,一次或一次也没有
X*  X,零次或多次
X+  X,一次或多次
X{n}  X,恰好n次
X{n,}  X,至少n次
X{n,m}  X,至少n次,但是不超过m次

Demo:

public class MyRegex {
    
    public static void main(String[] args) {
        
        System.out.println("? 一次或一次也没有:"+("12".matches("\\d?")));//false
        System.out.println("* 零次或多次:"+("123".matches("\\d*")));//true
        System.out.println("+ 至少出现一次:"+("1".matches("\\d+")));//true
        System.out.println("{次数} 恰好出现n次:"+("12345678911".matches("\\d{11}")));//true
        System.out.println("{次数,} 至少要出现指定的次数:"+("123".matches("\\d{3,}")));//true
        System.out.println("{次数1,次数2} 指定出现次数的范围:"+("1234".matches("\\d{3,4}")));//true
        
    }

}

三、字符类

[abc]  a、b或c(简单类)
[^abc] 任何字符,除了a、b或c(否定)
[a-zA-Z] a到z或A到Z,两头的字母包括在内(范围)
[a-d[m-p]] a到d或m到p:[a-dm-p](并集) 或直接写 [a-dm-p]
[a-z&&[def]] d、e或f(交集) 或直接写 [def]

注意:范围词里面不管内容多长,没有数量词的配合都只能匹配一个字符而已。

public class MyRegex {
    
    public static void main(String[] args) {
        
        System.out.println("d".matches("[abc]"));//false
        System.out.println("abc".matches("[abc]{3}"));//true 要匹配三个,必须加数量词
        System.out.println("%".matches("[^abc]"));//true
        System.out.println("字符可以是a-z之间:"+("a".matches("[a-z]")));//true
        System.out.println("字符可以是a-z、$、#之一:"+("a".matches("[a-zA-Z$#]")));//true
        
    }

}

需求:根据叠词进行切割字符串

public class Demo5 {
    
    public static void main(String[] args) {
        testSplit();
    }
    
    /*
     * 根据叠词进行切割
     */
    public static void testSplit() {
        String str = "大家家家明天天玩得得得得开心";
        //如果正则的内容需要被复用,那么需要对正则的内容进行分组。
        //分组的目的就是为了提高正则的复用性。组号不能指定,从1开始。
        String[] datas = str.split("(.)\\1+");
        System.out.println("数组的元素是:"+Arrays.toString(datas));
        //数组的元素是:[大, 明, 玩, 开心]
    }

}

():分组,分组的目的是为了让正则的内容被复用起来,组号从1开始。

((A)(B(C))):
第一组:((A)(B(C)))
第二组:(A)
第三组:(B(C))
第四组:(C)

package mydemo;

import java.util.Arrays;
import java.util.HashMap;
import java.util.Map;

public class Demo5 {
    
    public static void main(String[] args) {
        testSplit();
        replaceTest();
    }
    
    /*
     * 根据叠词进行切割
     */
    public static void testSplit() {
        String str = "大家家家明天天玩得得得得开心";
        //如果正则的内容需要被复用,那么需要对正则的内容进行分组。
        //分组的目的就是为了提高正则的复用性。组号不能指定,从1开始。
        String[] datas = str.split("(.)\\1+");
        System.out.println("数组的元素是:"+Arrays.toString(datas));
        //数组的元素是:[大, 明, 玩, 开心]
        
    }
    /**
     * 替换
     */
    public static void replaceTest() {
        //还原为: 我要学编程
        String str = "我我我我我要要要学学编编编程程程";
        //如果需要在replaceAll方法正则的外部引用组内容,使用“$组号”
        str = str.replaceAll("(.)\\1+", "$1");
        System.out.println(str);//我要学编程
        
    }

}

四、边界匹配器

^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾

注意:\b 单词边界匹配器只是代表了单词的开始或者结束部分,不匹配任何的字符。

public class Demo6 {
    
    public static void main(String[] args) {
        System.out.println("hello world".matches("hello\\bworld"));//false
        System.out.println("hello world".matches("hello\\b world"));//true
        System.out.println("hello,world".matches("hello\\b,world"));//true
        //任何一个可以分割字符的符号都可以表示单词的结束
    }

}

五、正则对象

查找:
指定字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的正则对象匹配任意的字符串用于创建Matcher对象,执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。

Pattern p = Pattern.compile("正则");
Matcher m = p.matcher("abc");
boolean b = m.matches();

1.Pattern(正则对象)

2.Matcher(匹配器对象)

匹配器使用的方法:

  • find():通知匹配器去匹配字符串,查找符合规则的字符串;找到返回true,否则返回false
  • group():获取符合规则的子串。

注意:使用group方法一定要先调用find方法让匹配器去查找符合规则的字符串,否则报错。

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Demo7 {
    
    public static void main(String[] args) {
        //找出三个字母组成的单词
        String content = "wo shi yi ming cai niao xian zai zai nu li bian hao";
        String reg = "\\b[a-zA-Z]{3}\\b";
        //先把字符串的正则编译成Pattern对象
        Pattern p = Pattern.compile(reg);
        //使用正则对象匹配字符串用于生产一个Matcher对象
        Matcher m = p.matcher(content);
        
        while(m.find()) {
            System.out.println(m.group());
            /*
             * shi cai zai zai hao
             */
        }
        
    }

}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351

推荐阅读更多精彩内容

  • 初衷:看了很多视频、文章,最后却通通忘记了,别人的知识依旧是别人的,自己却什么都没获得。此系列文章旨在加深自己的印...
    DCbryant阅读 3,996评论 0 20
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 22,855评论 4 46
  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,070评论 0 99
  • 正则表达式(regular expression)是一种可以在许多现代应用程序和编程语言中使用的特殊形式的代码模式...
    Android轮子哥阅读 11,468评论 4 16
  • 捕获组与反向引用 在正则表达式中,圆括号的一大作用是进行模式分组,而其还有另一个非常重要的作用,即定义捕获组。捕获...
    樱雨楼阅读 1,674评论 0 0