""(双引号) 与''(单引号) 差在哪?

还是回到我们的command line来吧...

经过前面两章的学习,应该很清楚当你在shell prompt后面敲打键盘, 直到按下Enter键的时候,你输入的文字就是command line了, 然后shell才会以进程的方式执行你所交给它的命令。 但是,你又可知道:你在command line中输入的每一个文字, 对shell来说,是有类别之分的呢?

简单而言,(我不敢说精确的定义,注 1),command line的每一个charactor, 分为如下两种:

  • literal:也就是普通的纯文字,对shell来说没特殊功能;
  • meta: 对shell来说,具有特定功能的特殊保留元字符。

Note
对于bash shell在处理comamnd line的顺序说明, 请参考 O'Reilly 出版社的 Learning the Bash Shell,2nd Edition, 第 177-180 页的说明,尤其是 178 页的流程图:Figure 7-1 ...

literal没什么好谈的, 像 abcd、123456 这些 "文字" 都是 literal...(so easy? _) 但 meta 却常使我们困惑...(confused?) 事实上,前两章,我们在command line中已碰到两个 似乎每次都会碰到的 meta:

  • IFS:有space或者tab或者Enter三者之一组成 (我们常用 space)
  • CR: 由Enter产生;

IFS是用来拆解command line中每一个词 (word) 用的, 因为shell command line是按词来处理的。 而CR则是用来结束command line用的,这也是为何我们敲Enter键, 命令就会跑的原因。

除了常用的IFSCR, 常用的 meta 还有:

meta 字符 meta 字符作用
= 设定变量
$ 作变量或运算替换 (请不要与shell prompt混淆)
> 输出重定向 (重定向 stdout)
< 输入重定向 (重定向 stdin)
| 命令管道
& 重定向 file descriptor 或将命令至于后台 (bg) 运行
() 将其内部的命令置于 nested subshell 执行,或用于运算或变量替换
{} 将期内的命令置于 non-named function 中执行,或用在变量替换的界定范围
; 在前一个命令执行结束时,而忽略其返回值,继续执行下一个命令
&& 在前一个命令执行结束时,若返回值为 true,继续执行下一个命令
|| 在前一个命令执行结束时,若返回值为 false,继续执行下一个命令
! 执行 histroy 列表中的命令
... ...

假如我们需要在command line中将这些保留元字符的功能关闭的话, 就需要 quoting 处理了。

bash中,常用的 quoting 有以下三种方法:

  • hard quote:''(单引号),凡在 hard quote 中的所有 meta 均被关闭;
  • soft quote:""(双引号),凡在 soft quote 中大部分 meta 都会被关闭,但某些会保留 (如 $);
  • escape: \ (反斜杠),只有在紧接在 escape(跳脱字符) 之后的单一 meta 才被关闭;

Note:

在 soft quote 中被豁免的具体 meta 清单,我不完全知道, 有待大家补充,或通过实践来发现并理解。

下面的例子将有助于我们对 quoting 的了解:

$ A=B C #空白符未被关闭,作为IFS处理
$ C:command not found.
$ echo $A
$ A="B C" #空白符已被关掉,仅作为空白符
$ echo $A
B C

在第一个给 A 变量赋值时,由于空白符没有被关闭, command line 将被解释为: A=B 然后碰到<IFS>,接着执行C命令 在第二次给 A 变量赋值时,由于空白符被置于 soft quote 中, 因此被关闭,不在作为IFSA=B<space>C 事实上,空白符无论在 soft quote 还是在 hard quote 中, 均被关闭。Enter 键字符亦然:

`$ A=``B` `> C` `> '` `$ echo "$A"` `B` `C`

在上例中,由于enter被置于 hard quote 当中,因此不再作为CR字符来处理。 这里的enter单纯只是一个断行符号 (new-line) 而已, 由于command line并没得到CR字符, 因此进入第二个shell prompt(PS2,以 > 符号表示), command line并不会结束,直到第三行, 我们输入的enter并不在 hard quote 里面, 因此没有被关闭, 此时,command line碰到CR字符,于是结束,交给 shell 来处理。

上例的Enter要是被置于 soft quote 中的话,CR字符也会同样被关闭:

`$ A="B` `> C` `> "` `$ echo $A` `B C`

然而,由于 echo $A时的变量没有置于 soft quote 中, 因此,当变量替换完成后,并作命令行重组时,enter被解释为IFS, 而不是 new-line 字符。

同样的,用 escape 亦可关闭 CR 字符:

`$ A=B\` `> C\` `>` `$ echo $A` `BC`

上例中的,第一个enter跟第二个enter均被 escape 字符关闭了, 因此也不作为CR来处理,但第三个enter由于没有被 escape, 因此,作为CR结束command line。 但由于enter键本身在 shell meta 中特殊性,在 \ escape 字符后面 仅仅取消其CR功能, 而不保留其 IFS 功能。

你或许发现光是一个enter键所产生的字符,就有可能是如下这些可能:

CR
IFS
NL(New Line)
FF(Form Feed)
NULL
...

至于,什么时候解释为什么字符,这个我就没法去挖掘了, 或者留给读者君自行慢慢摸索了...-

至于 soft quote 跟 hard quote 的不同,主要是对于某些 meta 的关闭与否,以 $ 来做说明:

$ A=B\ C
$ echo "$A"
B C
$ echo '$A'
$A

在第一个echo命令行中,$ 被置于 soft quote 中,将不被关闭, 因此继续处理变量替换, 因此,echo将 A 的变量值输出到屏幕,也就是 "B C" 的结果。

在第二个echo命令行中,<nobr>被置于hardquote中,则被关闭,因此,</nobr> 只是一个 <nobr>符号,并不会用来做变量替换处理,因此结果是</nobr> 符号后面接一个 A 字母:$A。

练习与思考: 如下结果为何不同?

tips: 单引号和双引号,在 quoting 中均被关闭了。

$ A=B\ C
$ echo '"$A"'  #最外面的是单引号
"$A"
$ echo "'$A'"  #最外面的是双引号
'B C'

在 CU 的 shell 版里,我发现很多初学者的问题, 都与 quoting 的理解有关。 比方说,若我们在 awk 或 sed 的命令参数中, 调用之前设定的一些变量时,常会问及为何不能的问题。

要解决这些问题,关键点就是:区分出 shell meta 与 command meta

前面我们提到的那些 meta,都是在 command line 中有特殊用途的, 比方说 {} 就是将一系列的 command line 置于不具名的函数中执行 (可简单视为 command block), 但是,awk 却需要用 {} 来区分出 awk 的命令区段 (BEGIN,MAIN,END). 若你在 command line 中如此输入:

 `$ awk {print $0} 1.txt`

由于 {} 在 shell 中并没有关闭,那 shell 就将 {print $0} 视为 command block, 但同时没有;符号作命令分隔,因此,就出现 awk 语法错误结果。

要解决之,可用 hard quote:

`awk '{print $0}'`

上面的 hard quote 应好理解,就是将原来的 {、、$、} 这几个 shell meta 关闭, 避免掉在 shell 中遭到处理,而完整的成为 awk 的参数中 command meta。

Note:

awk 中使用的 <nobr>0是awk中内建的fieldnubmer,而非awk的变量,awk自身的变量无需使用</nobr>。

要是理解了 hard quote 的功能,在来理解 soft quote 与 escape 就不难:

`awk "{print \$0}" 1.txt` `awk \{print \$0\} 1.txt`

然而,若要你改变 awk 的 <nobr>0的0值是从另一个shell变量中读进呢?比方说:已有变量</nobr>A 的值是 0, 那如何在command line中解决 awk 的 $$A 呢? 你可以很直接否定掉 hard quote 的方案:

`$ awk '{print $$A}' 1.txt`

那是因为 <nobr>A的</nobr> 在 hard quote 中是不能替换变量的。

聪明的读者 (如你!),经过本章的学习,我想,你应该可以理解为 为何我们可以使用如下操作了吧:

A=0
awk "{print \$$A}" 1.txt
awk  \{print\ \$$A\} 1.txt
awk '{print $'$A'}' 1.txt
awk '{print $'"$A"'}' 1.txt

或许,你能给出更多方案... _

更多练习:

  • http://bbs.chinaunix.net/forum/viewtopic.php?t=207178 一个关于 read 命令的小问题: 很早以前觉得很奇怪:执行 read 命令,然后读取用户输入给变量赋值, 但如果输入是以空格键开始的话,这空格会被忽略,比如:
read a  #输入:    abc
echo "$a" #只输出abc

原因: 变量 a 的值,从终端输入的值是以 IFS 开头,而这些 IFS 将被 shell 解释器忽略 (trim)。 应该与 shell 解释器分词的规则有关;

read a  #输入:\ \ \ abc
echo "$a" #只输出abc

需要将空格字符转义

Note:

IFS Internal field separators, normally space, tab, and newline (see Blank Interpretation section). ...... Blank Interpretation After parameter and command substitution, the results of substitution
are scanned for internal field separator characters (those found in IFS) and split into distinct arguments where such characters are found. Explicit null arguments (""or'') are retained.
Implicit null arguments(those resulting from parameters that have no values) are removed. (refre to: man sh)

解决思路:

  1. shell command line 主要是将整行 line 给分解 (break down) 为每一个单词 (word);
  2. 而词与词之间的分隔符就是 IFS (Internal Field Seperator)。
  3. shell 会对 command line 作处理 (如替换,quoting 等), 然后再按词重组。(注:别忘了这个重组特性)
  4. 当你用 IFS 来事开头一个变量值,那 shell 会先整理出这个词,然后在重组 command line。
  5. 然而,你将 IFS 换成其他,那 shell 将视你哪些 space/tab 为 “词”,而不是 IFS。那在重组时,可以得到这些词。

若你还是不理解,那来验证一下下面这个例子:

$ A="  abc" 
$ echo $A
abc
$ echo "$A" #note1
   abc
$ old_IFS=$IFS
$ IFS=;
$ echo $A
   abc
$ IFS=$old_IFS
$ echo $A
abc

Note:

  1. 这里是用 soft quoting 将里面的 space 关闭,使之不是 meta(IFS), 而是一个 literal(white space);
  1. IFS=; 意义是将 IFS 设置为空字符,因为; 是 shell 的元字符 (meta);

问题二:为什么多做了几个分号,我想知道为什么会出现空格呢?

$ a=";;;test"                              
$ IFS=";"                                  
$ echo $a                                  
   test                                                                         
$ a="   test"                              
$ echo $a                                  
   test                                                                         
$ IFS=" "                                  
$ echo $a                                  
test   

解答:

这个问题,出在IFS=;上。 因为这个;在问题一中的 command line 上是一个 meta, 并非";"符号本身。 因此,IFS=;是将 IFS 设置为 null charactor (不是 space、tab、newline)。

要不是试试下面这个代码片段:

$ old_IFS=$IFS
$ read A
;a;b;c
$ echo $A
;a;b;c
$ IFS=";"  #Note2
$ echo $A
a b c

Note:
要关闭;可用";"或者';'或者\;

思考问题二:文本处理:读文件时,如何保证原汁原味。

cat file | while read i
do
   echo $i
done

文件 file 的行中包含若干空,经过 read 只保留不重复的空格。 如何才能所见即所得。

cat file | while read i
do
   echo "X${i}X"
done

从上面的输出,可以看出 read,读入是按整行读入的; 不能原汁原味的原因:

  1. 如果行的起始部分有 IFS 之类的字符,将被忽略;
  2. echo $i的解析过程中,首先将 $i 替换为字符串, 然后对 echo 字符串中字符串分词,然后命令重组,输出结果; 在分词,与命令重组时,可能导致多个相邻的 IFS 转化为一个;
cat file | while read i
do
  echo "$i"
done

以上代码可以解决原因 2 中的,command line 的分词和重组导致 meta 字符丢失; 但仍然解决不了原因 1 中,read 读取行时,忽略行起始的 IFS meta 字符。

回过头来看上面这个问题:为何要原汁原味呢? cat 命令就是原汁原味的,只是 shell 的 read、echo 导致了某些 shell 的 meta 字符丢失;

如果只是 IFS meta 的丢失,可以采用如下方式: 将 IFS 设置为 null,即IFS=;, 在此再次重申此处;是 shell 的 meta 字符, 而不是 literal 字符; 因此要使用 literal 的 ;应该是\; 或者关闭 meta 的 (soft/hard) quoting 的";"或者';'

因此上述的解决方案是:

old_IFS=$IFS
IFS=; #将IFS设置为null
cat file | while read i
do
  echo "$i"
done
IFS=old_IFS #恢复IFS的原始值

现在,回过头来看这个问题,为什么会有这个问题呢; 其本源的问题应该是没有找到解决原始问题的最合适的方法, 而是采取了一个迂回的方式来解决了问题;

因此,我们应该回到问题的本源,重新审视一下,问题的本质。 如果要精准的获取文件的内容,应该使用 od 或者 hexdump 会更好些。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容