【time】Linux shell逐行读取文件的方法和效率

在Linux中有很多方法逐行读取一个文件的方法，其中最常用的就是下面的脚本里的方法，而且是效率最高，使用最多的方法。

为了给大家一个直观的感受，我们将通过生成一个大的文件的方式来检验各种方法的执行效率。

一、方法说明

方法1：while循环法

##############################

function while_read_bottom() {

while read LINE

echo $LINE

done < $FILENAME

}

###############################

注释：我习惯把这种方式叫做read釜底抽薪，因为这种方式在结束的时候需要执行文件，就好像是执行完的时候再把文件读进去一样。

方法2 ：管道法

############################

function while_read_line() {

cat $FILENAME | while read LINE

echo $LINE

done

}

############################

注释：我之所有把这种方式叫做管道法，相比大家应该可以看出来了。

当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。

方法3：文件描述符法

#############################

function while_read_line_fd() {

exec 3<&0

exec 0< $FILENAME

while read LINE

echo $LINE

done

exec 0<&3

}

##############################

注释：这种方法分2步骤

第一，通过将所有内容重定向到文件描述符3来关闭文件描述符0，为此我们用了语法 exec 3<&0 。

第二，将输入文件放送到文件描述符0，即标准输入。

方法4：for 循环

############################

function for_in_file() {

for i in `cat $FILENAME`

echo $i

done

}

##############################

注释：这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了，这里不多说。

二、效率测试

# cat time-test.sh

#######################################

#!/bin/bash

FILENAME="$1"

TIMEFILE="/tmp/loopfile.out" > $TIMEFILE

SCRIPT=$(basename $0)

function usage() {

echo -e "\nUSAGE: $SCRIPT file \n"

exit 1

}

function while_read_bottom() {

while read LINE

echo $LINE

done < $FILENAME

}

function while_read_line() {

cat $FILENAME | while read LINE

echo $LINE

done

}

function while_read_line_fd() {

exec 3<&0

exec 0< $FILENAME

while read LINE

echo $LINE

done

exec 0<&3

}

function for_in_file() {

for i in `cat $FILENAME`

echo $i

done

}

if [ $# -lt 1 ]; then

usage

echo -e " \n starting file processing of each method\n"

echo -e "method 1:"

echo -e "function while_read_bottom"

time while_read_bottom >> $TIMEFILE

echo -e "\n"

echo -e "method 2:"

echo -e "function while_read_line "

time while_read_line >> $TIMEFILE

echo -e "\n"

echo -e "method 3:"

echo "function while_read_line_fd"

time while_read_line_fd >> $TIMEFILE

echo -e "\n"

echo -e "method 4:"

echo -e "function for_in_file"

time for_in_file >> $TIMEFILE

##########################################

首先我们用命令生成一个10万行的文件 test.txt

# for i in {1..100000}; do echo $i >> test.txt; done

对各个方法进行测试，看那方法的执行效率最高。

# ./time-test.sh test.txt

可以看出，在各个方法中，for语句效率最高。

三、参考

Linux shell逐行读取文件的方法

https://blog.51cto.com/laoxu/1273840

shell中while循环的陷阱

https://www.cnblogs.com/f-ck-need-u/p/7431578.html

shell 中while read语句总结

https://blog.csdn.net/suofeng1234/article/details/51790110

https://www.cnblogs.com/centos-python/articles/8776217.html

Linux while read line

https://blog.csdn.net/roler_/article/details/17504039

http://www.360doc.com/content/15/0504/13/13670635_467863612.shtml

while read line in shell script - how to stop the loop?

https://unix.stackexchange.com/questions/253696/while-read-line-in-shell-script-how-to-stop-the-loop

最后编辑于：2019.03.31 09:13:41

【time】Linux shell逐行读取文件的方法和效率

一、方法说明

方法1：while循环法

方法2 ： 管道法

方法3： 文件描述符法

方法4：for 循环

二、效率测试

三、参考

方法2 ：管道法

方法3：文件描述符法