关于使用Python操作文件,无非就是对文件进行读、写、索引的操作,难度系数并不大,基本上就三个知识点:open方法的使用、操作file对象以及with语句。
open() 方法
首先,先来看一下open方法的常用语法格式。
open(file, mode='r', encoding='UTF-8')
file参数为文件的路径,mode参数即你想要进行何种操作,encoding即文件的编码。
关于mode参数可参考下列代码。
r:只读模式打开文件(默认模式)
w:只写模式打开文件,文件存在则覆盖,文件不存在就创建文件
a: 追加模式打开文件,新的内容写入到已有内容之后,文件若不存在,则创建新文件进行写入
t: 文本模式(默认)
b:二进制模式
x: 只写模式,新建一个文件,如果该文件已存在则会报错
+:可读可写,需配合r、w或a
一般来说,我们是需要上述mode参数中的2-3个配合使用的。例如:wb代表的则是二进制文件写入、r+与w+均为读写操作、rb+是读写二进制文件。不过需要注意的是,rw是不可以共同使用的。
open()方法会返回一个file对象,file对象也有很多的方法可供使用。
file对象
# 关闭文件。关闭后文件不能再进行读写操作
file.close()
# 从文件读取指定的字节数,如果未给定或为负则读取所有
file.read([size])
# 读取整行,包括 "\n" 字符
file.readline([size])
# 读取所有行并返回列表,若给定sizeint>0,则是设置一次读多少字节,这是为了减轻读取压力
file.readlines([sizeint])
# 返回文件当前位置,即显示当前文件指针的位置
file.tell()
# 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入
file.flush()
# 将字符串写入文件,返回的是写入的字符长度
file.write(str)
# 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符
file.writelines(sequence)
# 从文件的首行首字符开始截断size个字符,无size则从当前位置截断,后面的所有字符被删除
file.truncate([size])
首先需要注意,每次使用open()最好能配合使用close方法来关闭文件。关闭后的文件不能再进行读写操作,否则会触发 ValueError 错误。养成使用close关闭文件的习惯还是挺有意义的。
read和readline及readlines方法的区别是:read默认读取整个文件,也可指定字节读取。readline只能返回1行的文本,也就是读取到“\n”时停止。而readlines则会返回一个列表,以"\n"作为分隔符。不过需要注意,分隔符"\n"之类的转义字符也会被存在readlines返回的列表中。
关于文件指针的概念:文件被打开后会有一个指针指向文件的某个位置,我们将其称为文件指针,简单来讲,就是文件当前的位置所在,有点索引的味道。
truncate方法需要注意的是,windows系统下的换行代表2个字符。
with语句
其实,文件处理还有一个常用语法,那就是with语句。
在看with语句的语法之前,我们要思考些问题。有时我们会忘记close文件句柄,有时会转角遇见读取数据的异常,此时我们需要对open方法进行异常处理以使得代码更加健壮。
file = open('c:/text.txt','r')
try:
data = file.read()
finally:
file.close()
此时,虽然代码更健壮了,但也稍显有些冗余(一个文件还可以接受,当有多个文件的时候代码将特别不友好)。with语句便可以优雅的解决这个问题。案例格式如下:
with open('c:/text.txt','r') as file:
data = file.read()
with语句适用于对资源进行访问的场合,不管使用过程中是否发生异常都会执行必要的“清理”操作,释放资源。比如文件使用后自动关闭,线程中锁的自动获取和释放等。with拥有着简单优雅的语法,还可以很好的联系上下文处理产生的异常,可以说是python语言处理文件的一大利器。
当然,with语句如此强大,功能肯定不会限于文件处理,不过呢,这个话题太长了(笔者太懒了......)。笔者就先写到这了。