JavaSE基础知识梳理——正则表达式

十二、正则表达式

  • java.util.regex包下是java对正则表达式的处理,主要类有Pattern类和Mattcher类。

  • 概念

    1. ==普通字符==
    字母数字下划线以及没有特殊定义的标点符号。要匹配某个整体,就直接写这个整体就行,但是别放在[]里
    
    1. ==简单的转义字符==

      \t  \n \\ \? \+ \* \[ \] \+ \- \$ 等等,转义有特殊含义的字符
      
    2. ==标准字符集合==

      \d:代表任意一个数字  \D代表反向匹配,所有非数字。
      \w:代表一个字母或数字或下划线,即A-Z,a-z,0-9,_ 中任意一个。 \W代表反向匹配
      \s:包括空格、制表符、换行符等空白字符的其中任意一个。 \S反向匹配
      . :匹配任何一个字符,除了换行符,如果要匹配所有字符包括换行符,一般用[\s\S]
      
    3. ==自定义字符集合==

      用方括号表示[],能够匹配方括号中任意一个字符
      [ab@c]:匹配之中的任意一个字符
      [^abc]:取反,除了abc以外的任意字符
      [a-f]:范围,匹配a-f的所有字符
      [^a-f0-3]:a-f,0-3之外的任意一个字符
      
      特殊符号被包含到方括号中(自定义字符集),则失去特殊意义,除了^ 和 - 不变
      标准字符集合,除了小数点 . ,如果被包含于中括号,自定义字符集合将包含该集合。 
      如[\d.\-+]:将匹配\d代表的数字集合,. -和+
      
    4. ==量词==

      -贪婪模式:量词匹配默认是贪婪模式,即匹配的字符越多越好。比如有6个连续数字,\d{3,5}就会匹配5个数字,而不是3个数字
      -非贪婪模式:\d{3,6}?  ,匹配的越少越好,这里的?号必须跟在非贪婪模式大括号外
      \d\d 表示匹配2位数字
      \d{6}表示重复6次,匹配6位,即\d\d\d\d\d\d
      \d{3,6}表示重复3-6次,匹配3-6位
      (\d\d){6}表示对前面整体重复6次,匹配12位
      \d{3,}表示最少3次,可以多。但是没有\d{,3}这种写法
      
      ?匹配表达式0-1次出现,这个问号的含义不同于非贪婪模式。示例:a\d?b:表示匹配ab,且ab之间出现0次或1次数字,就相当于a\d{0,1}b
      * 匹配表达式0次或多次,如a\d*b
      + 匹配表达式至少1次出现,如a\d+b,表示ab之间至少出现1次数字
      总结一下
      
    5. ==字符边界(零宽度)==

      -匹配的是位置,而不是字符
      ^ :匹配字符串开头的位置,如^L ,匹配开头为L的字符,如果开头有这个字符就匹配到,没有就匹配不到,不同于^在[]号中是取反
      $ :匹配字符串末尾的位置,如L$ ,如果末尾有这个字符,就匹配到,没有就匹配不到
      \b :匹配一个单词的边界,这个单词前面的字符和后面的字符不能全是\w,即可以有1或0个\w,
      
    6. ==模式==

      case insensitive 忽略大小写
      singleline 单行模式,整个文本看做一个字符串
      multipleline 多行模式,如果要匹配多行模式中的最前面一个和最后一个,用\A和\Z,如a\A
      
    7. ==选择符和分组==

      | :或
      () :捕获组,即把这些内容组为一个整体,捕获组还有反向引用的作用:
           ([a-z]{2})\1,反向引用,即把匹配到的字符再重复,每个捕获组有个编号,这里是1。
           字符串 go to gogo ,最终匹配结果是gogo
           字符串 aaaa aabb abcd,([a-z])\1([a-z])\2 最终匹配结果是aabb ,aaaa
      (?:表达式) :这时候表达式是一个非捕获组  大量文本数据时要用,不常用
      
    8. ==预搜索(零宽断言)==

      -第一类 (?=表达式),表示匹配的内容后面必须有表达式里的内容,但是匹配结果不包含表达式内容。
      -第二类(?<=表达式),表示匹配的内容前面必须有表达式里的内容,但是匹配结果不包含表达式内容
      -第三类(?!表达式),表示匹配的内容后面不能有表达式的内容
      -第四类(?<!表达式),表示匹配的内容前面不能有表达式内容
      
    9. ==Java中使用正则表达式==

      // 匹配所有的数字
      String regex = "[\\d]";
      // 创建表达式对象pattern
      Pattern p = Pattern.compile(regex);
      FileInputStream in = new FileInputStream("a.txt");
      int len;
      byte[] bytes = new byte[1024];
      while ((len = in.read(bytes)) != -1){
          String s = new String(bytes);
          // 创建匹配Matcher对象,
          // .matches方法尝试将整个序列与该模式匹配,boolean类型,如果该序列完全满足匹配条件,则返回true
          // .find方法是分组,一个一个的匹配,index++。如果该组序列满足,则返回true
          // .group方法返回搜索到的匹配结果
          Matcher m = p.matcher(s);
          while (m.find()){
          System.out.print(m.group());
          }
      }
      
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342