java正则表达式

文本匹配

正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

常用应用

主要是分两种应用

  • 文本替换 例如 ide
  • 输入验证 例如 登录验证
  • 文本摘取 例如爬虫

案例

java中的正则表达式是通过Pattern实现的

/**
 * 字符串规则验证
 * @param regexp 正则表达式
 * @param str     待验证字符串
 * @return       字符串是否符合正则表达式规则
 */
public static boolean test(String regexp,String str){
    //编译正则表达式 返回Pattern对象
    Pattern pattern=Pattern.compile(regexp);
    //验证字符串返回Matcher对象
    Matcher match = pattern.matcher(str);
    //返回是否在字符串中找到匹配的子字符串
    return match.find();
}

正则表达式规则

[] 表示字符集合
() 表示组
\ 转译
{} 表示个数

正则表达式 实际上就是通过一个简化的规则去描述字符串
比如 "aaaa..." 有25个a
正则表达式的描述就是 a{25}
"aaa....bbb...."25个a 和26个b
正则表达式的描述就是 a{25}b{26}
这是精确匹配
假设 有一堆字符串 "a..."25个a "a..."10个a "a..."6个a
a{6,25} 表示 a个数可以是6个 7个,8个 。。。25个
这种是模糊匹配
假设 有一堆字符串 "a..."25个a "a..."10个a "a..."6个a
a{6,25} 表示 a个数可以是6个 7个,8个 。。。25个
这种是模糊匹配
那么有两个特殊的字符 来表示
a{1,} === a+ +表示1到多个
a{0,} === a* *表示0到多个

[] 集合

"a..b..aabbababab.."26个字符
假设有这个字符串
ab交替混合 不规则出现
正则表达式的描述就是 [ab]{26}
[1-5]{26}===[12345]{26}
[a-e]===[abcde]
[0-9]====\d 表示0-9
[A-Za-z0-9_]===\w 表示所有字符
[^0-3]表示不出现0123

\ 转义符

\n 换行符 \t tab符 \r 回车符 \f 换页符 \v 垂直tab
\d 数字 \w 字符和数字加下划线 \s [ \n\t\r\f\v]
\W [^\w] \D [^\d] \S [^\s]
\b 单词边界 \B [^\b]

() 组
()括起来的正则表达式 表示一个组
被括起来的正则表达式匹配的字符 可以用$1表示
假设有2个()
那么第一个就是$1 第二个就是$2

 System.out.println("123---123-----123".replaceAll("(1)2(3)","$1a$2b"));
 //输出
 //1a3b---1a3b-----1a3b

假设文件a

abc
bcd
ece

对文件每行的头尾加上单引号

String s=readFile();
writeFile(s.replaceAll("(\\w+)\\n","'$1'\n"))

完成一个Regexp的工具类

test方法

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegExp {

    /**
     * 字符串规则验证
     * @param regexp 正则表达式
     * @param str     待验证字符串
     * @return       字符串是否符合正则表达式规则
     */
    public static boolean test(String regexp,String str){
        //编译正则表达式 返回Pattern对象
        Pattern pattern= Pattern.compile(regexp);
        //验证字符串返回Matcher对象
        Matcher match = pattern.matcher(str);
        //返回是否在字符串中找到匹配的子字符串
        return match.find();
    }

    /**
     *  替换字符串
     * @param source
     * @param regexp
     * @param str
     * @return
     */
    public static String replace(String source,String regexp,String str){
        return source.replaceAll(regexp,str);
    }

    /**
     * 正则表达式替换方程
     */
    public interface ReplaceFunc{
        /**
         * 根据输入的匹配项返回替换的对象
         * @param args args[0]=matcher args[1]=$1,args[2]=$2 ......
         * @return 替换字符串
         */
         String func(String... args);
    }

    /**
     * 可控的替换过程
     * @param source 源字符串
     * @param regexp 正则表达式
     * @param func   替换方法
     * @return
     */
    public static String replace(String source,String regexp,ReplaceFunc func){
        Pattern pattern=Pattern.compile(regexp);
        Matcher matcher = pattern.matcher(source);
        StringBuffer sb = new StringBuffer();
        while(matcher.find()){
            String parms[]=new String[matcher.groupCount()+1];
            for (int i = 0; i <parms.length; i++) {
                parms[i]=matcher.group(i);
            }
            if(parms.length!=0){
                matcher.appendReplacement(sb, func.func(parms));
            }
        }
        matcher.appendTail(sb);
        return sb.toString();
    }
}

例子
这样我可以控制正则匹配的每一步 并作出对应的操作来修改返回字符串

String result = RegExp.replace("abc\nbcd\ncdc\n", "(\\w+)\\n", new RegExp.ReplaceFunc() {
    @Override
    public String func(String... args) {
        String $1 = args[1];
        if("abc".equals($1)){
            return "'ABC'\n";
        }else if("bcd".equals($1)){
            return "'BcD'\n";
        }
        return "'" + $1 + "'\n";
    }
});
System.out.println(result);
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容

  • Java的正则表达式讲解:(为了能看清,本文正则表达式用中文的句号代替英文句点) 英文句点符号:匹配单个任意字符。...
    红姑娘阅读 4,314评论 0 2
  • 1匹配验证-验证Email是否正确 2在字符串中查询字符或者字符串 3常用正则表达式 规则 正则表达式语法一个或...
    大赟哥阅读 469评论 0 0
  • 在其他语言中,\\表示:我想要在正则表达式中插入一个普通的(字面上的)反斜杠,请不要给它任何特殊的意义。 在 Ja...
    Grail_Oosaki阅读 422评论 0 0
  • 今天是六月三十号,是六月的最后一天,明天我们就迎来了下一个月——七月。想到七月,就想到了《七月与安生》这部电影,妈...
    杨茗辞阅读 319评论 2 2
  • 小恋人天天吵架 ...
    蒋珠莉阅读 221评论 2 5