1. 正则表达式
用于描述字符串的内容格式,使用它通常用于匹配一个字符串是否符合格式要求
正则表达式的语法:-------------------了解、不用纠结、不用深入研究,当你需要用时,可以去网上查
1.[]:表示一个字符,该字符可以是[]中指定的内容
例如:
[abc]:这个字符可以是a或b或c
[a-z]:表示任意一个小写字母
[a-zA-Z]:表示任意一个字母
[a-zA-Z0-9]:表示任意一个字母数字
[a-zA-Z0-9_]:表示任意一个数字字母下划线
[^abc]:该字符只要不是a或b或c
2.预定义字符:
.:表示任意一个字符,没有范围限制
\d:表示任意一个数字,等同于[0-9]
\w:表示任意一个单词字符,等同于[a-zA-Z0-9_]----单词字符指字母、数字和_
\s:表示任意一个空白字符
\D:不是数字
\W:不是单词字符
\S:不是空白字符
3.量词:
?:表示前面的内容出现0-1次
例如: [abc]? 可以匹配:a 或 b 或 c 或什么也不写
但是不能匹配:m或aaa
+:表示前面的内容最少出现1次
例如: [abc]+ 可以匹配:b或aaaaaaaaaa...或abcabcbabcbabcba....
但是不能匹配:什么都不写 或 abcfdfsbbaqbb34bbwer...
:表示前面的内容出现任意次(0-多次)---匹配内容与+一致,只是可以一次都不写
例如: [abc] 可以匹配:b或aaaaaaaaaa...或abcabcba....或什么都不写
但是不能匹配:abcfdfsbbaqbb34bbwer...
{n}:表示前面的内容出现n次
例如: [abc]{3} 可以匹配:aaa 或 bbb 或 aab 或abc 或bbc
但是不能匹配: aaaa 或 aad
{n,m}:表示前面的内容出现最少n次最多m次
例如: [abc]{3,5} 可以匹配:aaa 或 abcab 或者 abcc
但是不能匹配:aaaaaa 或 aabbd
{n,}:表示前面的内容出现n次以上(含n次)
例如: [abc]{3,} 可以匹配:aaa 或 aaaaa.... 或 abcbabbcbabcba....
但是不能匹配:aa 或 abbdaw...
4.()用于分组,是将小括号里面的内容看做是一个整体
例如: (abc){3} 表示abc整体出现3次. 可以匹配abcabcabc
但是不能匹配aaa 或abcabc
(abc|def){3}表示abc或def整体出现3次.
可以匹配: abcabcabc 或 defdefdef 或 abcdefabc
但是不能匹配abcdef 或abcdfbdef
2. String支持与正则表达式相关的方法
-
常用方法:
1)length()方法,确定字符串的长度,返回字符串中的字符数
注意:是length()方法,数组是length属性2)equals()方法,比较存储在两个字符串对象的内容是否一致,区别于==(判断两个字符串在内存中的地址, 即判断是否是同一个字符串对象,object类中equals方法和==是一致的)。
3)equalsIgnoreCase()方法:不区分大小写的判断值是否一致
toLowerCase()方法:转换为小写
toUpperCase()方法:转换为大写4 ) 字符串连接
方式1:使用 +
String str = "aaa"+"bbb"+"ccc";
方式2:使用 concat 方法
String str = str.concat("ddd").concat("ccc").concat("eee");5)字符串提取方法
字符串中单个字符查找
indexOf(int ch/String str)
查找当前字符串中字符或子串,返回字符或子串在当前字符串中从左边起首次出现的位置,若没有返回-1。
indexOf(int ch/String str, int fromIndex)
与第一种类似,区别在于该方法从fromIndex位置向后查找。
lastIndexOf(int ch/String str)
该方法与第一种类似,区别在于该方法从字符串的末尾位置向前查找,返回的位置仍然是左起位置。
lastIndexOf(int ch/String str, int fromIndex)
该方法与第二种方法类似,区别于该方法从fromIndex位置向前查找。
字符串截取:substring方法可以提取字符串中的子串,该方法有两种常用参数:1)substring(int begin)
//该方法从begin位置(下标)起,从当前字符串中取出剩余的字符作为一个新的字符串返回。
2)substring(int beg, int end)
//该方法从begin位置(下标)起,从当前字符串中取出到end-1位置的字符作为一个新的字符串返回。6 ) 字符串去除首尾空格: trim()方法
截去字符串两端的空格,但对于中间的空格不处理。7 ) 字符串判断开始、结束
statWith(String prefix)
endWith(String suffix)
用来比较当前字符串的起始字符或子字符串prefix和终止字符或子字符串suffix是否和当前字符串相同8 ) 字符串判断是否包含子串
contains(String str)
判断子字符串是否被包含在字符串中,并返回一个布尔类型的值。9 ) 字符串分割
split()方法,将一个字符串分割为子字符串,结果作为字符串数组返回10 ) 按照指定位置获取单个字符
charAt(下标)11 ) 直接将字符串转换为字符数组
toCharArray()12 ) 字符串转字节数组
getBytes()13 ) 字符串替换
replace("旧串","新串")
-示例
- matches():使用给定的正则表达式(regex)验证当前字符串的格式是否符合要求,若符合则返回true,否则返回false
public class MatchesDemo { public static void main(String[] args) { /* 邮箱正则表达式: [a-zA-Z0-9_]+@[a-zA-Z0-9]+(\.[a-zA-Z]+)+ 注意: \.中的这个\是正则表达式中的转义符 \\.中的第1个\,是在转义正则表达式中的\ */ String email = "726320273@qq.com"; String regex = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+"; //使用regex匹配email是否符合格式要求 boolean match = email.matches(regex); if(match){ System.out.println("是正确的邮箱格式"); }else{ System.out.println("不是正确的邮箱格式"); } } }
- replaceAll():将当前字符串中满足正则表达式(regex)的部分给替换为给定的字符串(s)
public class ReplaceAllDemo { public static void main(String[] args) { String line = "abc123def456ghi78"; line = line.replaceAll("[0-9]+","#NUMBER#"); System.out.println(line); } }
- split():将当前字符串按照满足正则表达式(regex)的部分进行拆分,将拆分出的以String[]形式来返回
public class SplitDemo { public static void main(String[] args) { String line = "abc123def456ghi"; String[] data = line.split("[0-9]+"); //按数字拆分(数字就拆没了) System.out.println(Arrays.toString(data)); //将data数组转换为字符串并输出 line = "123.456.78"; data = line.split("\\."); //按.拆(.就拆没了) System.out.println(Arrays.toString(data)); //最开始就是可拆分项(.),那么数组第1个元素为空字符串------------"" //如果连续两个(两个以上)可拆分项,那么中间也会拆出一个空字符串----"" //如果末尾连续多个可拆分项目,那么拆出的空字符串被忽略 line = ".123.456..78........"; data = line.split("\\."); //按.拆(.就拆没了) System.out.println(Arrays.toString(data)); } }