在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法。
为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率。
一、方法说明
方法1:while循环法
##############################
function while_read_bottom() {
while read LINE
do
echo $LINE
done < $FILENAME
}
###############################
注释:我习惯把这种方式叫做read釜底抽薪,因为这种方式在结束的时候需要执行文件,就好像是执行完的时候再把文件读进去一样。
方法2 : 管道法
############################
function while_read_line() {
cat $FILENAME | while read LINE
do
echo $LINE
done
}
############################
注释:我之所有把这种方式叫做管道法,相比大家应该可以看出来了。
当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。
方法3: 文件描述符法
#############################
function while_read_line_fd() {
exec 3<&0
exec 0< $FILENAME
while read LINE
do
echo $LINE
done
exec 0<&3
}
##############################
注释: 这种方法分2步骤
第一,通过将所有内容重定向到文件描述符3来关闭文件描述符0,为此我们用了语法 exec 3<&0 。
第二,将输入文件放送到文件描述符0,即标准输入。
方法4:for 循环
############################
function for_in_file() {
for i in `cat $FILENAME`
do
echo $i
done
}
##############################
注释:这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了,这里不多说。
二、效率测试
# cat time-test.sh
#######################################
#!/bin/bash
FILENAME="$1"
TIMEFILE="/tmp/loopfile.out" > $TIMEFILE
SCRIPT=$(basename $0)
function usage() {
echo -e "\nUSAGE: $SCRIPT file \n"
exit 1
}
function while_read_bottom() {
while read LINE
do
echo $LINE
done < $FILENAME
}
function while_read_line() {
cat $FILENAME | while read LINE
do
echo $LINE
done
}
function while_read_line_fd() {
exec 3<&0
exec 0< $FILENAME
while read LINE
do
echo $LINE
done
exec 0<&3
}
function for_in_file() {
for i in `cat $FILENAME`
do
echo $i
done
}
if [ $# -lt 1 ]; then
usage
fi
echo -e " \n starting file processing of each method\n"
echo -e "method 1:"
echo -e "function while_read_bottom"
time while_read_bottom >> $TIMEFILE
echo -e "\n"
echo -e "method 2:"
echo -e "function while_read_line "
time while_read_line >> $TIMEFILE
echo -e "\n"
echo -e "method 3:"
echo "function while_read_line_fd"
time while_read_line_fd >> $TIMEFILE
echo -e "\n"
echo -e "method 4:"
echo -e "function for_in_file"
time for_in_file >> $TIMEFILE
##########################################
首先我们用命令生成一个10万行的文件 test.txt
# for i in {1..100000}; do echo $i >> test.txt; done
对各个方法进行测试,看那方法的执行效率最高。
# ./time-test.sh test.txt
可以看出,在各个方法中,for语句效率最高。
三、参考
Linux shell逐行读取文件的方法
https://blog.51cto.com/laoxu/1273840
https://www.cnblogs.com/f-ck-need-u/p/7431578.html
shell 中while read语句总结
https://blog.csdn.net/suofeng1234/article/details/51790110
https://www.cnblogs.com/centos-python/articles/8776217.html
Linux while read line
https://blog.csdn.net/roler_/article/details/17504039
http://www.360doc.com/content/15/0504/13/13670635_467863612.shtml
while read line in shell script - how to stop the loop?
https://unix.stackexchange.com/questions/253696/while-read-line-in-shell-script-how-to-stop-the-loop