正则表达式与通配符

1. 正则表达式与通配符

  • 正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
  • 通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。

2. 通配符:

通配符 作用
? 匹配一个任意字符
* 匹配0个或任意多个字符,也就是可以匹配任何内容
[] 匹配中括号中任意一个字符
[-] 匹配中括号中任意一个字符,-代表一个范围
[^] 逻辑非,表示匹配不是中括号内的一个字符

3. 基本正则表达式

元字符 作用
* 前一个字符匹配0次或任意多次。
. 匹配除了换行符外任意一个字符。
^ 匹配行首。例如:^hello会匹配以hello开关的行。
$ 匹配行尾。例如:hello$会匹配以hello结尾的行。
[] 匹配中括号中指定的任意一个字符,只匹配一个字符。例如:[aeiou]匹配任意一个元音字符,[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字母和一位数字构成的两位字符。
[^] 匹配除中括号的字符以外的任意一个字符。例如:[0-9]匹配任意一位非数字字符,[a-z]匹配任意一位非小写字母。
\ 转义符。用于取消,将特殊符号的含义取消。
\{n\} 表示其前面的字符恰好出现n次。例如:[0-9]\{4\}匹配4位数字,[1][3-8][0-9]\{9\}匹配手机号码。
\{n,\} 表示其前面的字符出现不小于n次。例如:[0-9]\{2,\}表示两位及以上的数字。
\{n,m\} 表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]\{6,8\}匹配6到8位的小写字母。

例子:

  • “*”前一个字符匹配0次,或任意多次
# 匹配所有内容,包括空白行
grep "a*" test_rule.txt

# 匹配至少包含一个a的行
grep "aa*" test_rule.txt

# 匹配至少包含两个连续a的字符串
grep "aaa*" test_rule.txt

# 匹配最少包含4个连接a的字符串
grep "aaaaa*" test_rule.txt
  • “.”匹配除换行符外任意一个字符
# "s..d" 会匹配在s和d这两个字母之间一定有两个字符的单词
grep "s..d" test_rule.txt

# 匹配在s和d字母之间有任意字符
grep "s.*d" text_rule.txt

# 匹配所有内容
grep ".*" test_rule.txt
  • “^”匹配行首,“$”匹配行尾
# 匹配以大写“M”开关的行
grep "^M" test_rule.txt

# 匹配以小写“n”结尾的行
grep "n$" test_rule.txt

# 匹配空白行
grep "^$" test_rule.txt
  • “[]”匹配中括号中指定的任意一个字符,只匹配一个字符
# 匹配s和i字母中,要不是a、要不是o
grep "s[ao]id" test_rule.txt

# 匹配任意一个数字
grep "[0-9]" test_rule.txt

# 匹配用小写字母开头的行
grep "^[a-z]" test_rule.txt
  • “[^]”匹配除中括号的字符以外的任意一个字符
# 匹配不用小写字母开关的行
grep "^[^a-z]" test_rule.txt

# 匹配不用字母开头的行
grep "^[^a-zA-Z]" test_rule.txt
  • “\”转义符
# 匹配使用“.”结尾的行
grep "\.$" test_rule.txt
  • “\{n\}”表示其前面的字符恰好出现n次
# 匹配a字母连续出现3次的字符串
grep "a\{3\}" test_rule.txt

# 匹配包含连续的三个数字的字符串
grep "[0-9]\{3\}" test_rule.txt
  • “\{n,m\}” 匹配其前面的字符至少出现n次,最多出现m次
# 匹配在字母s和i之间有最少一个a,最多3个a
grep "sa\{1,3\}i" test_rule.txt
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容