删除文本文件中的特定行
前面已经介绍过从列表和字典中删除元素的方法,今天介绍一下从文件中删除元素的方法。
写在前面的话:
本人是一枚生物学的学生,由于对生物信息学特别感兴趣,于是想自学生物信息学(新手莫怪)。了解到生物信息学要有编程基础,尤其是要会一门编程语言,例如:R语言、Python、Perl等,还要熟悉Linux系统,作为生信小白,听说Python挺简单的,于是就自学了Python,花了两天时间了解了Python的基础语法后,今天想做个练习题试试手(实践是检验真理的唯一标准)。
删除文本文件中的特定行
有几种简单的方法可以从文本文件中筛选特定的行,这里推荐其中的两个。 假设有输入文件 text.txt,要删除的是第一行、第二行、第五行和第六行,可以通过将列表切片来删除它们:
lines = open('text.txt') .readlines( )
open('new.txt' , 'w') .writelines(lines[2:4]+lines[6:])
注意,在这个例子中,输入文件的行已通过文件对象方法 readlines()存储在一个列表中了,如果对很大的文件进行操作就会非常不方便。 那么在这种情况下,使用 for. . . if 组 合会更好。
要删除正确的行,可以用计数器变量来跟踪行号。 在下面的例子中,要删除的行 数(第一位、第二位、第五位和第六位)存储于列表中([1, 2,5, 6]) ,然后计数器初始化为 0, 对于每个新行增加 1。 当计数器为 1、 2 、 5 或 6(即,它在[1 , 2 , 5 , 6]列表中)时,该行就被跳 过(pass); 否则就被写人输出文件:
in_file = open('text.txt')
out_file = open('new.txt','w')
index = 0
indices_to_remove = [1,2,5,6]
for line in in_file:
index = index + 1
if index not in indices_to_remove:
out_file.write(line)
out_file.close()
如果不希望引入计数器,还可以使用内置函数 enumerate():
out_file = open('new.txt','w')
indices_to_remove = [1,2,5,6]
for index,line in enumerate(open('text.txt')):
if (index+1) not in indices_to_remove:
out_file.write(line)
out_file.close()
对于给定的列表 x, enwnerate(x)返回索引 i 和 x[i]值的元组(i, x[i]) :
>>> x = [1 , 2 , 5 , 6]
>>> for i , j in enumerate(x):
prìnt (i,j)
0 1
1 2
2 5
3 6
在上面的例子中,对于文件的每一行 enumerate()返回一个行号(从 0 开始)和相应的内容所组成的元组。
日常结尾:
虽然这是个小小的计算程序,但对于初学者的我来说每一次对原代码的升级改造,哪怕是读懂后的注释都感觉是一次进步提升,总之代码虽小,动手最重要!希望更多学习Python的爱好者不要像我一样眼高手低,学习编程就是要,思考,敲码,思考,敲码,敲码,再敲码!!