1、grep命令介绍
grep命令:是一个shell命令,是shell中文本三剑客之一,作用是在文件中提取和匹配符合条件的字符串行
。
grep命令是一个非常常见的命令,和find命令有很多非常相似的地方,所以在这里先说明。
命令格式如下:
[root@localhost ~ ] # grep [选项] “搜索内容” 文件名
选项:
-i:忽略大小写
-n:输出行号(显示原始文件中的行号)
-v:反向查找
--color=auto:搜索出的关键字用颜色显示
举例:
# 输出行号。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc
# 把你要搜索的内容用红色高亮显示。
[root@localhost ~]# grep --color=auto "123" abc
注意:如果要搜索的内容中没有空格,“搜索内容”部分就可以不加双引号,如果“搜索内容”中有空格,则一定要加双引号。
2、find命令和grep命令的区别(重点)
1)find命令
find命令用于在系统中搜索符合条件的文件名
,如果需要模糊查询,则使用通配符进行匹配,通配符是完全匹配(find命令可以通过-regex选项,把匹配规则转为正则表达式规则,但是不建议如此)。
2)grep命令
grep命令用于在文件中搜索符合条件的字符串
,如果需要模糊查询,则使用正则表达式进行匹配,正则表达式是包含匹配。
注意:完全匹配和包含匹配的规则不是
find命令
和grep命令
的区别,是通配符
和正则表达式
的区别。
3、通配符与正则表达式的区别
通配符:用于匹配文件名,是完全匹配。下面举例说明:
- ?:匹配一个任意字符。
- *:匹配0个或任意多个任意字符,也就是可以匹配任何内容。
- []:匹配中括号中任意一个字符。例如,[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c。
- [-]:匹配中括号中任意一个字符,-代表一个范围。例如,[a-z]代表匹配一个小写字母。
- [^]:逻辑非,表示匹配不是中括号内的一个字符。例如,[^0-9]代表匹配一个不是数字的字符。
# 通过通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc
[root@localhost ~ ]# find . -name "a?c"
./acc
./abc
其他同理
提示:只要是操作文件名或者目录名的命令都可以是用通配符。如rm命令。
正则表达式:用于匹配字符串,是包含匹配。下面简单举例:
- ?:匹配前一个字符重复0次,或1次(?是扩展正则,需要使用egrep命令。注shell分为标准正则和扩展正则。)。
- *:匹配前一个字符重复0次,或任意多次。
- []:匹配中括号中任意一个字符。例如,[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c。
- [-]:匹配中括号中任意一个字符,-代表一个范围。例如,[a-z]代表匹配一个小写字母。
- [^]:逻辑非,表示匹配不是中括号内的一个字符。例如,[^0-9]代表匹配一个不是数字的字符。
- ^:匹配行首(限位符)。
- $:匹配行尾(限位符)。
其中主要是是?和*,在通配符和正则表达式的不同。
关于
*
注意:
[root@localhost ~ ] # grep "a*" abc
向上面命令中,单写一个字母+*是没有任何意义的。结果会显示文件中所有内容,包括空白行。
因为*是匹配前一个字符重复0次,或任意多次。0次代表什么都没有,也就是没有条件的筛选,所以就显示文件汇总所有的内容。而
[root@localhost ~ ] # grep "aa*" abc
命令,则表示查找文件中包含有小写字母a的行。和开头无关,正则是含有匹配,包含就会被列出。
如果想要在正则当中去匹配开头的内容,就需要使用限位符。如下:
[root@localhost ~] # grep "^a" abc
abc
abc 123
abc123abc
[root@localhost ~] # grep "^aa*" abc 和上面查询结果也一样。
小练习:
[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
上面证明是包含匹配
[root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
如果只想要搜索两个a的字符串,就需要使用限位符,其中的3和b都属于限位符。
限位符是包括自己与其他字符串不匹配的任何字符的统称。