LINUX sed命令的使用
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
a\ 在当前⾏下⾯插⼊⽂本。
i\ 在当前⾏上⾯插⼊⽂本。
c\ 把选定的⾏改为新的⽂本。
d 删除,删除选择的⾏。
D 删除模板块的第⼀⾏。
s 替换指定字符
l 列表不能打印字符的清单。
n 读取下⼀个输⼊⾏,⽤下⼀个命令处理新的⾏⽽不是⽤第⼀个命令。
N 追加下⼀个输⼊⾏到模板块后⾯并在⼆者间嵌⼊⼀个新⾏,改变当前⾏号码。
p 打印模板块的⾏。
P(⼤写) 打印模板块的第⼀⾏。
q 退出Sed。
w file 写并追加模板块到file末尾。
W file 写并追加模板块的第⼀⾏到file末尾。
g 表⽰⾏内全⾯替换。
p 表⽰打印⾏。
w 表⽰把⾏写⼊⼀个⽂件。
x 表⽰互换模板块中的⽂本和缓冲区中的⽂本。
y 表⽰把⼀个字符翻译为另外的字符(但是不⽤于正则表达式)
\1 ⼦串匹配标记
& 已匹配字符串标记
^ 匹配⾏开始,如:/^sed/匹配所有以sed开头的⾏。
$ 匹配⾏结束,如:/sed$/匹配所有以sed结尾的⾏。
. 匹配⼀个⾮换⾏符的任意字符,如:/s.d/匹配s后接⼀个任意字符,最后是d。
* 匹配0个或多个字符,如:/*sed/匹配所有模板是0个或多个空格后紧跟sed的⾏。
[] 匹配⼀个指定范围内的字符,如/[sS]ed/匹配sed和Sed。
[^] 匹配⼀个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的⼀个字⺟开头,紧跟ed的⾏。
\(..\) 匹配⼦串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
& 保存搜索字符⽤来替换其他字符,如s/love/**&**/,love这成**love**。
\< 匹配单词的开始,如:/\<love/匹配包含以love开头的单词的⾏。
\> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的⾏。
x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的⾏。
x\{m,\} 重复字符x,⾄少m次,如:/0\{5,\}/匹配⾄少有5个0的⾏。
x\{m,n\} 重复字符x,⾄少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的⾏。
正则表达式 \w\+ 匹配每⼀个单词,使⽤ [&] 替换它,& 对应于之前所匹配到的单词:
echo this is a test line | sed 's/\w\+/[&]/g'
[this] [is] [a] [test] [line]
所有以192.168.0.1开头的⾏都会被替换成它⾃已加localhost:
sed 's/^192.168.0.1/&localhost/' file
192.168.0.1localhost
匹配给定样式的其中⼀部分:
echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/'
this is 7 in a number
命令中 digit 7,被替换成了 7。样式匹配到的⼦串是 7,\(..\) ⽤于匹配⼦串,对于匹配到的第⼀个⼦串就标记为 \1,依此类
推匹配到的第⼆个结果就是 \2,例如:
echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/'
BBB aaa
所有在模板test和check所确定的范围内的⾏都被打印:
sed -n '/test/,/check/p' file
打印从第5⾏开始到第⼀个包含以test开始的⾏之间的所有⾏:
sed -n '5,/^test/p' file
对于模板test和west之间的⾏,每⾏的末尾⽤字符串aaa bbb替换:
sed '/test/,/west/s/$/aaa bbb/' file
-e选项允许在同⼀⾏⾥执⾏多条命令:
sed -e '1,5d' -e 's/test/check/' file
上⾯sed表达式的第⼀条命令删除1⾄5⾏,第⼆条命令⽤check替换test。命令的执⾏顺序对结果有影响。如果两个命令都是替换
命令,那么第⼀个替换命令将影响第⼆个替换命令的结果。
和 -e 等价的命令是 --expression:
sed --expression='s/test/check/' --expression='/love/d' file
>gi|1002620271|ref|NC_029525.1| Coturnix japonica isolate 7356 chromosome 10, Coturnix japonica 2.0, whole genome shotgun sequence
TACTCCCCAAGAA
通过sed命令,将其更改为
>NC_029525.1
TACTCCCCAAGAA
命令如下:
sed 's/^[^ ]*[|]\([^|]*\)[|].*$/>\1/' original.fasta > updated.fasta
命令拆解:
该命令通过贪婪匹配匹配倒数第二个|,为了保险采用[|],[|]限定匹配内容,最后\1调用匹配行的子串
贪婪匹配符:"." "+" "*"
非贪婪匹配:"?"
http://man.linuxde.net/sed