join
join命令主要用来实现两个文件中记录的连接操作,即将两个文件中具有相同域的记录合并输出到标准设备,类似于数据库中的连接。
基本语法
join [参数] 文件1 文件2
主要参数如下所示:
参数 | 功能 |
---|---|
-a <1或2> | 除了显示以共同域连接的结果外, -a1:显示第1个文件中没有共同域的记录 -a2:显示第2个文件中没有共同域的记录 |
-i | 比较域内容时,忽略大小写差异 |
-o | 设置结果显示的格式 |
-t | 修改域分隔符 |
v <1或2> | 与参数-a类似,只显示未能成功以相同域进行连接的结果 |
-1 和 -2 | -1:设置文件1用于连接的域 -2:设置文件2用于连接的域 |
join示例
-
1、-a和-v参数
当两个文件进行连接时,文件1和文件2可能会存在记录的差异,从而导致文件1中的记录无法在文件2中找到,反之也一样。join命令默认的结果是不显示这些未进行连接的记录(类似于数据库的中内连接)。-a和-v参数就是用于显示这些未连接的记录。-a和-v两者的区别如下:
-a:显示以共同域进行连接的结果,类似于数据库的中左右连接,join可同时带上 -a1 和-a2 两个参数,则相当于数据库中的全连接
-v:仅显示未进行连接的结果
详细的示例如下所示:
-
2、-o参数
join命令默认显示两个连接文件所有域,并按照一定的顺序显示。-o参数则可指定需要显示的域。如1.1则代表文件1的第一个域,2.3则代表显示文件2的第3个域,详细示例如下:
-
3、-1和-2参数
join默认进行连接的域都为文件的第1域,如果我们需要指定其他的域做为连接域条件,则需要使用-1和-2参数。其中-1用于设置文件1用于连接的域,-2用于设置文件2用于连接的域,详细示例如下所示:
join命令在对两个文件进行连接时,两个文件必须已经按照连接域排序。类似于数据库中的交叉连接
tr
tr命令主要用于字符转换功能。
基本语法
tr [参数] 字符串1 字符串2 <输入文件
< 表示将输入文件重定向到标准输入,与sort/uniq/join命令不同,它只能从标准输入读取数据。
主要参数如下所示:
参数 | 含义 |
---|---|
-c | 反选字符串1中的字符集 |
-d | 删除字符串1中出现的所有字符 |
-s | 删除所有重复出现的字符序列,仅保留一个 |
tr示例
-
1、-d参数
tr命令的-d参数很简单,功能主要是删除字符串出现的所有字符,示例如下所示:
利用-d参数也可以删除一些特殊的字符,如换行符、TAB符等,支持的主要特殊字符如下所示:
特殊字符 | 含义 | 八进制形式 |
---|---|---|
\a | 提示声音 | \007 |
\b | 退格符 | \010 |
\n | 换行符 | \012 |
\r | 回车键 | \015 |
\t | TAB键 | \011 |
-
2、-s参数
-s参数主要去掉文件中存在重复的项,最终的结果仅保留一个。详细示例如下所示:
-
3、-c参数
-c是反选字符串的字符并将其替换,详细示例如下所示:
除了上面三个参数的常用用法后,tr也经常被用来执行替换操作,如将字符串1替换为字符串2,详细示例如下所示: