(2020.11.17 Tues)
文本流text stream
在Linux中,文本流是不同程序不同文件之间的数据桥梁,通过文本流,不同模块可以方便的进行协作,它也是Unix阵营的一个特征。
Linux中以字节为数据单位,一个字节对应了8位二进制数字,比如01100001就是一个字节。利用ASCII编码可以把一个字节转换成一个字符,即字幕'a'。ASCII编码把从0到255的数字对应为英文字母、数字和常用符号。因此,一个字节总可以转换为一个ASCII字符。
字节的优势在于可转换为人类可读(human readable)的字符。
存储文本的文件,相当于一个存储数据的房子。在Linux的设计哲学中,有“万物解释文件(everything is a file)”的说法。除了一般存储用户数据的文件,表示文件位置的目录,也是一种文件。系统的配置文件、软链接,都是在存储设备中的文件。
除了存储设备,很多设备也有读写数据的需求,GPIO和UART端口都有读写功能,Linux把所有读写数据的对象都当做文件。通过操作设备文件,就可以和设备进行数据交流。在UART编程中,通过/dev/AMA0这个文件和UART端口的设备直接对话。/dev目录下还有很多其他的设备文件。
由于文件总和数据存储联系在一起,因此有万物皆是文本流(everything is a stream of bytes)的说法。在数据跑来跑去的过程中,数据像有序流动的束流,故称为文本流,有如下特征
- 文本性:数据以字节为单位,可以转换为文本
- 有序性:数据的前后顺序不会错乱
- 完整性:数据内容不会丢失
标准输入stdin标准输出stdout标准错误stderr
当Linux启动一个进程时,会自动打开三个流的端口,标准输入(standard input)、标准输出(standard output)、标准错误(standard error),类似于入口,出口和紧急出口,进程会根据需要有选择的使用。
以bash进程为例,默认情况下,bash的标准输入连接到键盘,stdout和stderr连接到屏幕。键盘输入一串字符,会成为文本流通过stdin进入bash。bash拿到了输入,不仅进行内部处理,还会把相同的字符输出到stdout,最终显示在屏幕上。
另一个例子是ls命令,它获得当前路径下的文件名后,会把这些文件名合成一端文本,用标准输出端口来打印到终端。再比如设定密码的passwd命令会通过stdin来获得用户输入的密码。如果程序又错误信息,那么错误信息会通过stderr端口输出,如删除一个不存在的文件,会返回下面结果
$rm none-exist-file
rm: none-exist-file: No such file or directory
重新定向redirect
当bash执行一个命令时,bash会fork一个子进程用于命令的运行。默认情况下,由于子进程的stdin和bash相同,因此输出内容出现在bash窗口。如果想让文本流流到文件,而不是显示器上,可以利用重定向redirect的机制。比如讲ls命令输出的文本流导入一个文件
$ls > output.log
$ls >> output.log
>重新定向了ls的stdin。而使用>>也可以重新定向。不同于>,>>导出的文件如果已经存在,>>不会覆盖该文件如>那样,而是在当前文件的结尾附加这条指令的返回结果。
>和>>只会重定向stdout,如果是stderr,需要用2>符号,这里的2代表了stderr
$rm none-exist-file 2> error.log
如果stdout和stderr指向不同的文件,用1>和2>的组合
$ls 1> output.log 2> error.log
如果需要stdout和stderr指向相同的文件,可以使用&>
$ls &> output_error.log
可以使用<符号改变stdin的来源。比如grep命令,可以检查一端文本流中是否含有特定的文本,只是用grep命令,它将等待键盘输入
$grep abc
如果输入一行字包括abc,那么grep将把这一行输出到stdin中。可以重新定向grep的stdin,让输入内容来自文件而不是键盘
$grep abc < context.txt #注意空格
此时context.txt的文本内容将会作为stdin。如果想从context.txt导入文件的同时把stdout和stderr输出到特定文件,可联合使用<和>
$grep abc < context.txt &> output.txt
Reference
1 Vamei,周梓昕著,树莓派开始玩转Linux,中国工信出版集团,电子工业出版社