从屌丝到架构师的飞越（API篇）-简单的正则表达式

一.介绍

正则表达式，又称规则表达式。计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。例如，在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件（例如sed和grep）普及开的。正则表达式通常缩写成“regex”。

二.知识点介绍

1、概述

2、字符串中涉及正则的常用方法

3、正则表达式的匹配规则

三.上课视频对应说明文档

1、概述

正则表达式（英语：Regular Expression，在代码中常简写为regex）。

正则表达式是一个字符串，使用单个字符串来描述、用来定义匹配规则，匹配一系列符合某个句法规则的字符串。在开发中，正则表达式通常被用来检索、替换那些符合某个规则的文本。

正则表达式也是一个字符串，用来定义匹配规则。参照帮助文档，在Pattern类中有简单的规则定义，可以结合字符串类的方法使用。

String类中，使用正则表达式匹配完整字符串的方法为：

public boolean matches(String regex)

调用方法的字符串为被规则匹配的字符串

regex字符串为匹配规则

返回值为布尔型，符合规则返回true，不符合返回false

参照API文档后，我们简单了解了匹配规则，这里给出手机号与邮箱的匹配规则：

邮箱规则：String regex = ”\\w+@\\w{2,7}\\.\\w{2,3}”;

手机号规则：String regex = ”[1][3,4,5,7,8][0-9]{9}”;

如：

String data = “aaa@163.com”;

boolean result = data.matches(“\\w+@\\w{2,7}\\.\\w{2,3}”); //返回结果为true

String data2 = “itheima.cn”;

boolean result2 = data2.matches(“\\w+@\\w{2,7}\\.\\w{2,3}”); //返回结果为false

代码示例：

import java.util.Scanner;

* 简单正则表达式

* 正则表达式：匹配指定规则的字符串

* 判断一个字符串

* 1.长度大于等于5小于等于15

* 2.数字开头不包含0

public class Demo01 {

public static void main(String[] args) {

Scanner sc = new Scanner(System.in);

String s = sc.nextLine();

boolean flag = check(s);

boolean flag2 = check2(s);

System.out.println(flag);

System.out.println(flag2);

}

public static boolean check2(String s){

// String regex="[1-9].{4,14}";

// boolean b = s.matches(regex);

// return b ;

return s.matches("[1-9].{4,14}");

}

public static boolean check(String s) {

boolean flag = true;

//判断长度

if(s.length()>=5 &&s.length()<=15){

char c = s.charAt(0);

//判断数字开头不包含0

if(!(c>='1' && c<='9')){

flag = false;

}

}else{

flag = false;

}

return flag;

}

2、字符串中涉及正则的常用方法

（1）public boolean matches(String regex) //完整字符串匹配规则(判断字符串是否匹配给定的规则)

代码示例：

* public boolean matches(String regex) 判断调用方法的字符串与regex字符串是否匹配

* 字符类

* [abc] a、b 或 c（简单类）

* [^abc] 任何字符，除了 a、b 或 c（否定）

* [a-zA-Z] a 到 z 或 A 到 Z，两头的字母包括在内（范围）

* 预定义字符类

* . 任何字符（与行结束符可能匹配也可能不匹配）

* \w 单词字符：[a-zA-Z_0-9]

* 26个字母大小写数字 _

* \b 单词边界

* abc?bcda aaa！

* Greedy 数量词

* X? X，一次或一次也没有

* X* X，零次或多次

* X+ X，一次或多次

* X{n} X，恰好 n 次

* X{n,} X，至少 n 次

* X{n,m} X，至少 n 次，但是不超过 m 次

public class Demo02 {

public static void main(String[] args) {

String s ="aaaac";

String regex = "a{1,3}c";

boolean matches = s.matches(regex);

System.out.println(matches);

}

举例：校验qq号码.

1: 要求必须是5-15位数字

2: 0不能开头

代码演示：

String qq = "604154942";

String regex = "[1-9][0-9]{4,14}";

boolean flag2 = qq.matches(regex);

举例：校验手机号码

1：要求为11位数字

2：第1位为1，第2位为3、4、5、7、8中的一个，后面9位为0到9之间的任意数字。

代码演示：

String phone = "18800022116";

String regex = "1[34578][0-9]{9}";

boolean flag = phone.matches(regex);

（2）public String[] split(String regex) //将符合规则的字符串作为切割符切割

（3）public String replaceAll(String regex,String replacement) //将符合规则的字符串替换为新字符串

代码示例：

* public String[] split(String regex) //将符合规则的字符串作为切割符切割

* public String replaceAll(String regex,String replacement) //将符合规则的字符串替换为新字符串

public class Demo03 {

public static void main(String[] args) {

String girlName = "姗姗.慧慧.柳柳.莲莲.糖糖 ";

String[] girlNames = girlName.split("\\.");

// System.out.println(girlNames[0]);

// System.out.println(girlNames[1]);

// System.out.println(girlNames[2]);

// System.out.println(girlNames[3]);

// System.out.println(girlNames[4]);

for (int i = 0; i < girlNames.length; i++) {

String string = girlNames[i];

System.out.println(string);

}

String replaceAll = girlName.replaceAll("柳", "岩岩");

System.out.println(replaceAll);

}

举例：把文字中的数字替换成*

代码演示：

String s = "Hello12345World6789012";

String regex = "[0-9]";

String result = s.replaceAll(regex, "*");

3、补充内容:正则表达式的匹配规则

参照帮助文档，在Pattern类中有正则表达式的的规则定义，正则表达式中明确区分大小写字母。我们来学习语法规则。

正则表达式的语法规则：

（1）字符：x

含义：代表的是字符x

例如：匹配规则为 "a"，那么需要匹配的字符串内容就是 ”a”

（2）字符：\\

含义：代表的是斜线字符'\'

例如：匹配规则为"\\" ，那么需要匹配的字符串内容就是 ”\”

（3）字符：\t

含义：制表符

例如：匹配规则为"\\t" ，那么对应的效果就是产生一个制表符的空间

（4）字符：\n

含义：换行符

例如：匹配规则为"\\n"，那么对应的效果就是换行,光标在原有位置的下一行

（5）字符：\r

含义：回车符

例如：匹配规则为"\\r" ，那么对应的效果就是回车后的效果,光标来到下一行行首

（6）字符类：[abc]

含义：代表的是字符a、b 或 c

例如：匹配规则为"[abc]" ，那么需要匹配的内容就是字符a，或者字符b，或字符c的一个

（7）字符类：[^abc]

含义：代表的是除了 a、b 或 c以外的任何字符

例如：匹配规则为"[^abc]"，那么需要匹配的内容就是不是字符a，或者不是字符b，或不是字符c的任意一个字符

（8）字符类：[a-zA-Z]

含义：代表的是a 到 z 或 A 到 Z，两头的字母包括在内

例如：匹配规则为"[a-zA-Z]"，那么需要匹配的是一个大写或者小写字母

（9）字符类：[0-9]

含义：代表的是 0到9数字，两头的数字包括在内

例如：匹配规则为"[0-9]"，那么需要匹配的是一个数字

（10）字符类：[a-zA-Z_0-9]

含义：代表的字母或者数字或者下划线(即单词字符)

例如：匹配规则为" [a-zA-Z_0-9] "，那么需要匹配的是一个字母或者是一个数字或一个下滑线

（11）预定义字符类：.

含义：代表的是任何字符

例如：匹配规则为" . "，那么需要匹配的是一个任意字符。如果，就想使用 . 的话，使用匹配规则"\\."来实现

（12）预定义字符类：\d

含义：代表的是 0到9数字，两头的数字包括在内，相当于[0-9]

例如：匹配规则为"\\d "，那么需要匹配的是一个数字

（13）预定义字符类：\w

含义：代表的字母或者数字或者下划线(即单词字符)，相当于[a-zA-Z_0-9]

例如：匹配规则为"\\w "，，那么需要匹配的是一个字母或者是一个数字或一个下滑线

（14）边界匹配器：^

含义：代表的是行的开头

例如：匹配规则为^[abc][0-9]$ ，那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号

（15）边界匹配器：$

含义：代表的是行的结尾

例如：匹配规则为^[abc][0-9]$ ，那么需要匹配的内容以[0-9]这个结束, 相当于右双引号

（16）边界匹配器：\b

含义：代表的是单词边界

例如：匹配规则为"\\b[abc]\\b" ，那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])

（17）数量词：X?

含义：代表的是X出现一次或一次也没有

例如：匹配规则为"a?"，那么需要匹配的内容是一个字符a，或者一个a都没有

（18）数量词：X*

含义：代表的是X出现零次或多次

例如：匹配规则为"a*" ，那么需要匹配的内容是多个字符a，或者一个a都没有

（19）数量词：X+

含义：代表的是X出现一次或多次

例如：匹配规则为"a+"，那么需要匹配的内容是多个字符a，或者一个a

（20）数量词：X{n}

含义：代表的是X出现恰好 n 次

例如：匹配规则为"a{5}"，那么需要匹配的内容是5个字符a

（21）数量词：X{n,}

含义：代表的是X出现至少 n 次

例如：匹配规则为"a{5, }"，那么需要匹配的内容是最少有5个字符a

（22）数量词：X{n,m}

含义：代表的是X出现至少 n 次，但是不超过 m 次

例如：匹配规则为"a{5,8}"，那么需要匹配的内容是有5个字符a 到 8个字符a之间

（23）逻辑运算符：XY

含义：代表的是X后跟Y

例如：匹配规则为"ab"，那么需要匹配的字符串内容就是 ”ab”

（24）逻辑运算符：X|Y

含义：代表的是X 或 Y

例如：匹配规则为"a|b"，那么需要匹配的字符串内容就是 ”a”或”b”

（25）逻辑运算符：(X)

含义：代表的是（）括号内的数据作为一组数据出现，(X)的方式称为正则表达式中的组

例如：匹配规则为"(hello)+"，那么需要匹配的内容是组内数据要出现多次，如”hellohellohello”；或者组内数据出现一次，如”hello”。

注意实现：

在定义正则表达式的匹配规则字符串的里面，想再次使用组中的内容，可通过\\1来进行使用

例如：正则表达式的匹配规则为"(a) == \\1"；

使用数据"a == a"进行匹配结果为true；使用数据"a == b"进行匹配结果为false。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,406评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,732评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,711评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,380评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,432评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,301评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,145评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,008评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,443评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,649评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,795评论 1赞 347
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,501评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,119评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,731评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,865评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,899评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,724评论 2赞 354

从屌丝到架构师的飞越（API篇）-简单的正则表达式

推荐阅读更多精彩内容