1.问题描述
今天使用
caffe
训练一个网络来分割医学图像中的血管,提取了几万张patch
,要对patch
进行标注,之后将所有文件名及它对应的类别输入到一个文档中。首先使用ls -R ./dir/*.jpg > file.txt
命令可以将dir
文件中所有的文件名输出到file.txt
中,之后的问题就是如何在file.txt的每一行后添加该文件的标签。
2.问题解决方法
最后还是想用简单的脚本解决,发现使用sed
命令可以方便得在文件每一行后添加一个字符。首先看一下sed
命令。
3.sed命令简介
sed
是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space)
,接着用sed
命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。Sed
主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。
[root@www ~]# sed [-nefr] [动作]
选项与参数:
-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。
动作说明: [n1[,n2]]function
n1, n2 :不见得会存在,一般代表『选择进行动作的行数』,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则『 10,20[动作行为] 』
function:
a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d :删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!
4.问题的具体解决方法
假设处理的文本为test.file
,在每行的头添加字符,比如HEAD
,命令如下:
sed 's/^/HEAD&/g' test.file
在每行的行尾添加字符,比如TAIL
,命令如下:
sed 's/$/&TAIL/g' test.file
几点说明:
^
代表行首,$
代表行尾s/$/&TAIL/g
中的字符g
代表每行出现的字符全部替换,如果想在特定字符处添加,g
就有用了,否则只会替换每行第一个,而不继续往后找了如果想导出文件,在命令末尾加
> outfile_name
;如果想在原文件上更改,添加选项-i
,如也可以把两条命令和在一起,在
test.file
的每一行的行头和行尾分别添加字符HEAD
,TAIL
,命令:
sed '/./{s/^/HEAD&/;s/$/&TAIL/}' test.file
这样就处理完了!总之恰当使用sed命令是可以避免来回打开文件造成的时间浪费,可以使用sed命令在linux脚本中做一些更好玩的事情。希望这篇文章可以给你一些帮助~