之前开发中一直把通配符当成正则表达式来使用,现在总结一下自己的理解:
通配符 wildcard,又称元字符 meta character, 代表的是 bash 的一个功能。正则表达式 regular expression,则是一种字符串的表示方式。
找到一篇文章,顺手翻译了一下:
Don't Confuse Regular Expressions with Wildcards
别把正则表达式和通配符混淆了
在讨论正则表达式之前,高能预警一下初学者:正则表达式和看上去很像的 shell 通配符(用于匹配文件名)常常被当成一回事。它们的共同之处只是:星号 (*), 问号(?),小括号 (),中括号 [ ],管道 |, 这些字符在 shell 和 使用正则表达式的程序中都有特殊的含义。虽然个别符号的用法 —— 几乎 —— 一模一样,但它们代表的含义是不同的。
但请牢记,shell 命令,如 find,用的是通配符,而不是正则表达式。
最近很多程序,如 find 命令,可以通过命令行参数的形式来使用正则表达式。举栗,在我的 Linux 上 find 命令可以用 -regex 和 -iregex 参数,完成查找匹配正则表达式的文件名,-regex 代表区分大小写,-iregex 代表不区分大小写。但是,在我的苹果 OS X 上的 find 命令就不支持上述功能。
因为 shell 通配符在被 shell 传递给执行程序之前就被展开,所以当在 shell 中使用正则表达式的时候,必须给特殊符号加引号 (27.12小节有详细说明)。
举栗:
$ grep [A-Z]*.c chap[12]
grep 命令会被 shell 展开为:
grep Array.c Bug.c Comp.c chap1 chap2
然后 grep 命令就会在 chap1 chap2 目录中去找匹配正则表达式的的“Array.c”,“Bug.c”,“Comp.c”。
大多数情况下建议使用单引号 (') 把正则表达式包裹起来。也可以用 echo 命令在命令行查看 echo 的输出,了解 shell 是如何处理这些特殊字符的。