linux处理文本利器sed

Sed是UNIX/Linux系统上提供的将编辑工具自动化的编辑器,可以直接编辑文件。Sed以行为编辑单位(行编辑器)。相比vim,gedit等编辑工具,Sed编辑文件只需要一条命名就可以解决很多的问题,而且Sed对正则表达式的支持也非常好,的确是Linux下文本处理的利器。

sed 是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。



1.使用方法

命令格式: sed [options] 'command'file(s)

选项

-e<script>或--expression=<script>:以选项中的指定的script来处理输入的文本文件;

-f<script文件>或--file=<script文件>:以选项中指定的script文件来处理输入的文本文件;

-h或--help:显示帮助;

-n或--quiet或——silent:仅显示script处理后的结果;

-V或--version:显示版本信息。

参数

文件:指定待处理的文本文件列表。

sed命令

a\  在当前行下面插入文本。

i\  在当前行上面插入文本。

c\  把选定的行改为新的文本。

d  删除,删除选择的行。

D  删除模板块的第一行。

s  替换指定字符

h  拷贝模板块的内容到内存中的缓冲区。

H  追加模板块的内容到内存中的缓冲区。

g  获得内存缓冲区的内容,并替代当前模板块中的文本。

G  获得内存缓冲区的内容,并追加到当前模板块文本的后面。

l  列表不能打印字符的清单。

n  读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。

N  追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。

p  打印模板块的行。

P  (大写) 打印模板块的第一行。

q  退出Sed。

b lable  分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。

r file  从file中读行。

t label  if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。

T label  错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。

w file  写并追加模板块到file末尾。 

 W file  写并追加模板块的第一行到file末尾。

 ! # 表示后面的命令对所有没有被选定的行发生作用。 

 = # 打印当前行号码。 

 #  把注释扩展到下一个换行符以前。

sed替换标记

g 表示行内全面替换。

 p  表示打印行。 

 w  表示把行写入一个文件。 

 x  表示互换模板块中的文本和缓冲区中的文本。  

y  表示把一个字符翻译为另外的字符(但是不用于正则表达式)

\1  子串匹配标记

&  已匹配字符串标记


sed元字符集

^  匹配行开始,如:/^sed/匹配所有以sed开头的行。

$  匹配行结束,如:/sed$/匹配所有以sed结尾的行。

.  匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d。

*  匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。

[]  匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed。

[^]  匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。

\(..\)  匹配子串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。

&  保存搜索字符用来替换其他字符,如s/love/ **&** /,love这成 **love** 。

\<  匹配单词的开始,如:/\<love/匹配包含以love开头的单词的行。

\>  匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行。

x\{m\}  重复字符x,m次,如:/0\{5\}/匹配包含5个0的行。

x\{m,\}  重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行。

x\{m,n\}  重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行。



sed用法实例


替换操作:s命令

替换文本中的字符串:

sed's/book/books/'file

-n选项 和 p命令 一起使用表示只打印那些发生替换的行:

sed -n 's/test/TEST/p' file

直接编辑文件 选项-i ,会匹配file文件中每一行的所有book替换为books:

sed-i's/book/books/g'file

全面替换标记g

使用后缀 /g 标记会替换每一行中的所有匹配:

sed's/book/books/g'file

当需要从第N处匹配开始替换时,可以使用 /Ng:

echosksksksksksk|sed's/sk/SK/2g'

skSKSKSKSKSKechosksksksksksk|sed's/sk/SK/3g'

skskSKSKSKSKechosksksksksksk|sed's/sk/SK/4g'

skskskSKSKSK

定界符

命令中字符 / 在sed中作为定界符使用,也可以使用任意的定界符:

sed's:test:TEXT:g'sed's|test|TEXT|g'

定界符出现在样式内部时,需要进行转义:

sed's/\/bin/\/usr\/local\/bin/g'

删除操作:d命令


删除空白行:

sed'/^$/d'file

删除文件的第2行:

sed'2d'file

删除文件的第2行到末尾所有行:

sed'2,$d'file

删除文件最后一行:

sed'$d'file

删除文件中所有开头是test的行:

sed'/^test/'dfile

已匹配字符串标记&

正则表达式 \w+ 匹配每一个单词,使用 [&] 替换它,& 对应于之前所匹配到的单词:

echo this is a testline | sed 's/\w\+/[&]/g'

[this] [is] [a] [test] [line]

所有以192.168.0.1开头的行都会被替换成它自已加localhost:

sed's/^192.168.0.1/&localhost/'file192.168.0.1localhost

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 简介 sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(p...
    699b979fc4da阅读 4,673评论 0 1
  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 8,491评论 2 25
  • 知识点 sort uniq cut wc sed命令 awk命令 crontab定时器 sort sort 命令对...
  • 基础命令 主要的命令和快捷键 Linux系统命令由三部分组成:cmd + [options]+[operation...
    485b1aca799e阅读 4,788评论 0 0
  • 走进嘉宾企业面试策划 首先,我将其分为三部分来解读。嘉宾的沟通协商,面试人才的方向,和这场面试的策划者。 我们先要...
    寒雨辰阅读 988评论 0 0