java正则表达式

介绍

正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

几个重要的正则表达式:

  • 用户名(6-15位字母和数字的组合): /^(?=.[A-Za-z])(?=.\d)[A-Za-z\d]{6,15}$/;
  • 电话 :/^1[34578]\d{9}$/
  • 两位小数: /^[0-9]+.?[0-9]{0,2}$/
  • 邮箱: /^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$/
  • url:/^[a-zA-z]+://(\w+(-\w+))(\.(\w+(-\w+)))(\?\S)?$/
    更多数字的正则

常用应用

主要是分三种应用

  • 文本替换 例如 ide
  • 输入验证 例如 登录验证
  • 文本摘取 例如爬虫

案例

/**
 * 字符串规则验证
 * @param regexp 正则表达式
 * @param str     待验证字符串
 * @return       字符串是否符合正则表达式规则
 */
public static boolean test(String regexp,String str){
    //编译正则表达式 返回Pattern对象
    Pattern pattern=Pattern.compile(regexp);
    //验证字符串返回Matcher对象
    Matcher match = pattern.matcher(str);
    //返回是否在字符串中找到匹配的子字符串
    return match.find();
}

正则表达式规则

  • {} 表示个数
  • [] 表示字符集合
  • () 表示组
  • \ 转译

1.{} 表示个数

正则表达式 实际上就是通过一个简化的规则去描述字符串
比如 "aaaa..." 有25个a
正则表达式的描述就是 a{25}
"aaa....bbb...."25个a 和26个b
正则表达式的描述就是 a{25}b{26}
这是精确匹配
假设 有一堆字符串 "a..."25个a "a..."10个a "a..."6个a
a{6,25} 表示 a个数可以是6个 7个,8个 。。。25个
这种是模糊匹配
假设 有一堆字符串 "a..."25个a "a..."10个a "a..."6个a
a{6,25} 表示 a个数可以是6个 7个,8个 。。。25个
这种是模糊匹配
那么有两个特殊的字符 来表示
a{1,} === a+ +表示1到多个
a{0,} === a* *表示0到多个

2.[] 集合

"a..b..aabbababab.."26个字符

假设有这个字符串
ab交替混合 不规则出现
正则表达式的描述就是 [ab]{26}
[1-5]{26}===[12345]{26}
[a-e]===[abcde]
[0-9]====\d 表示0-9
[A-Za-z0-9_]===\w 表示所有字符
[^0-3]表示不出现0123

3.\ 转义符

\n 换行符 \t tab符 \r 回车符 \f 换页符 \v 垂直tab
\d 数字 \w 字符和数字加下划线 \s [ \n\t\r\f\v]
\W [^\w] \D [^\d] \S [^\s]
\b 单词边界 \B [^\b]

4.() 组

()括起来的正则表达式 表示一个组
被括起来的正则表达式匹配的字符 可以用$1表示
假设有2个()
那么第一个就是$1 第二个就是$2

eg1:

 System.out.println("123---123-----123".replaceAll("(1)2(3)","$1a$2b"));
 //输出
 //1a3b---1a3b-----1a3b

eg2:

abc
bcd
ece

对文件每行的头尾加上单引号

   System.out.println("abc\nbcd\ncdc\n".replaceAll("(\\w+)\\n","'$1'\n"));
结果

完成一个Regexp的工具类(成果)

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * Created by ASUS on 2017/9/11.
 */
public class RegExp {  /**
 * 字符串规则验证
 * @param regexp 正则表达式
 * @param str     待验证字符串
 * @return       字符串是否符合正则表达式规则
 */
public static boolean test(String regexp,String str){
    //编译正则表达式 返回Pattern对象
    Pattern pattern= Pattern.compile(regexp);
    //验证字符串返回Matcher对象
    Matcher match = pattern.matcher(str);
    //返回是否在字符串中找到匹配的子字符串
    return match.find();
}

    /**
     *  替换字符串
     * @param source
     * @param regexp
     * @param str
     * @return
     */
    public static String replace(String source,String regexp,String str){
        return source.replaceAll(regexp,str);
    }

    /**
     * 正则表达式替换方程
     */
    public interface ReplaceFunc{
        /**
         * 根据输入的匹配项返回替换的对象
         * @param args args[0]=matcher args[1]=$1,args[2]=$2 ......
         * @return 替换字符串
         */
        String func(String... parms);
    }

    /**
     * 可控的替换过程
     * @param source 源字符串
     * @param regexp 正则表达式
     * @param func   替换方法
     * @return
     */
    public static String replace(String source,String regexp,ReplaceFunc func){
        Pattern pattern=Pattern.compile(regexp);
        Matcher matcher = pattern.matcher(source);
        StringBuffer sb = new StringBuffer();
        while(matcher.find()){

            String parms[]=new String[matcher.groupCount()+1];
            for (int i = 0; i <parms.length; i++) {
                parms[i]=matcher.group(i);
            }
            if(parms.length!=0){
                matcher.appendReplacement(sb, func.func(parms));
            }
        }
        matcher.appendTail(sb);
        return sb.toString();
    }


}

例子
这样我可以控制正则匹配的每一步 并作出对应的操作来修改返回字符串
eg1:

String result = RegExp.replace("abc\nbcd\ncdc\n", "(\\w+)\\n", new RegExp.ReplaceFunc() {
    @Override
    public String func(String... parms) {
        String $1 = parms[1];
        if("abc".equals($1)){
            return "'ABC'\n";
        }else if("bcd".equals($1)){
            return "'BcD'\n";
        }
        return "'" + $1 + "'\n";
    }
});
System.out.println(result);
结果

eg2:

   String abc= RegExp.replace("123\n--123\n--123\n", "(1+)2(3)", new RegExp.ReplaceFunc() {
            @Override
            public String func(String ...parms) {
                String $1=parms[1];
                String $2=parms[2];

                return $1+"a"+$2;
            }
        });
        System.out.println(abc);
结果
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351

推荐阅读更多精彩内容

  • Java的正则表达式讲解:(为了能看清,本文正则表达式用中文的句号代替英文句点) 英文句点符号:匹配单个任意字符。...
    红姑娘阅读 4,354评论 0 2
  • 1匹配验证-验证Email是否正确 2在字符串中查询字符或者字符串 3常用正则表达式 规则 正则表达式语法一个或...
    大赟哥阅读 471评论 0 0
  • 表达式意义: 1.字符 x 字符 x。例如a表示字符a {Java学习资料免费分享微信:tangniu5206...
    尚学先生阅读 331评论 0 0
  • 一首歌反复听五六遍就会生厌了。 人是很善变的动物,前几天晚上朋友几个相约吃烧烤,有男生喝大了,认真地沉思了一会儿说...
    千秋名阅读 169评论 0 0
  • 少年时代的伙伴自大洋彼岸归来探亲,多年未见,把盏竟夜长谈,我们聊到故乡种种情形,特别谈到了家乡方言,兴之所至...
    L__Smile阅读 824评论 0 0