(译)正则表达式之:别与通配符混淆了

之前开发中一直把通配符当成正则表达式来使用,现在总结一下自己的理解:

通配符 wildcard,又称元字符 meta character, 代表的是 bash 的一个功能。正则表达式 regular expression,则是一种字符串的表示方式。

找到一篇文章,顺手翻译了一下:

Don't Confuse Regular Expressions with Wildcards
别把正则表达式和通配符混淆了

在讨论正则表达式之前,高能预警一下初学者:正则表达式和看上去很像的 shell 通配符(用于匹配文件名)常常被当成一回事。它们的共同之处只是:星号 (*), 问号(?),小括号 (),中括号 [ ],管道 |, 这些字符在 shell 和 使用正则表达式的程序中都有特殊的含义。虽然个别符号的用法 —— 几乎 —— 一模一样,但它们代表的含义是不同的。

但请牢记,shell 命令,如 find,用的是通配符,而不是正则表达式。

最近很多程序,如 find 命令,可以通过命令行参数的形式来使用正则表达式。举栗,在我的 Linux 上 find 命令可以用 -regex 和 -iregex 参数,完成查找匹配正则表达式的文件名,-regex 代表区分大小写,-iregex 代表不区分大小写。但是,在我的苹果 OS X 上的 find 命令就不支持上述功能。

因为 shell 通配符在被 shell 传递给执行程序之前就被展开,所以当在 shell 中使用正则表达式的时候,必须给特殊符号加引号 (27.12小节有详细说明)。

举栗:

$ grep [A-Z]*.c chap[12]

grep 命令会被 shell 展开为:

grep Array.c Bug.c Comp.c chap1 chap2 

然后 grep 命令就会在 chap1 chap2 目录中去找匹配正则表达式的的“Array.c”,“Bug.c”,“Comp.c”。

大多数情况下建议使用单引号 (') 把正则表达式包裹起来。也可以用 echo 命令在命令行查看 echo 的输出,了解 shell 是如何处理这些特殊字符的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1 概述 通配符和正则表达式经常会引起混乱,本文两者之间的区别进行比较。 通配符用于匹配文件名,shell在做Pa...
    ghbsunny阅读 3,493评论 0 1
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,169评论 0 9
  • 注:本篇文章只为方便查看,特此保留,如有冒犯,敬请谅解!!! 本文目标 30分钟内让你明白正则表达式是什么,并对它...
    阿杰Alex阅读 1,504评论 0 10
  • 《Linux命令行与shell脚本编程大全》,4 E -- Chapter 20 一、 什么是正则表达式 1. 定...
    生信摆渡阅读 870评论 2 3
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,438评论 0 5