0. 概述
文件的操作:
关于一个文件的一生:
文件的诞生,创建文件。在linux下可以使用touch、vim等命令进行创建。使用python,可以使用open的操作进行创建。
文件的修改,此处只说明python的相关操作。
- 打开文件,open()
- 修改文件,write()
- 读取文件,read()
- 关闭文件,close()
文件的结束。linux下使用rm命令进行删除。
1.open
open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
open()是相关操作中参数最多,也是最复杂的一个方法。
file:文件名称;
mode:打开文件时候,文件具有的属性;
buffering:缓冲区;
encoding: 编码,仅文本模式使用;
errors:什么样的编码会被屏蔽;
newline:换行符的转换,进文本模式使用;
closefd:关闭文件描述符;
opener:
其中最常使用的是前5个参数,文件名不可缺省。各项缺省值如下:
open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
1. file
此处使用文件的相对路径和绝对路径均可,建议使用绝对路径。
如果不指定路径,则默认当前路径。当前路径也是相对路径开始的地方。
2. mode
文件访问的两种模式:
- 文本模式
连续的字符,字符流。按照字符处理。 - 二进制模式
字节流,将文件按照字节理解。
mode
r:只读打开,不存在会抛出异常,默认(正常思维的打开方式);
w:只写打开,文件不存在时候创建,文件存时且有内容就先清空。 只写(永远打开的是一个空文件);
x:创建文件,并且只写打开,文件存在则报错。 只写(文件不能存在,创建并打开的是一个空文件);
a:文件存在,则追加。文件不存在时候,创建文件。 只写(永远都是写在最后);
b:使用二进制模式打开;
t:缺省的,使用文本模式打开;
+ 读写打开一个文件,给原来只读。只写方式打开提供,缺省的读写能力。
只写打开的文件是不能读的。
程序是如何定位打开时候的位置呢?
文件内部都维护了一个指针,可以理解为windows下的光标位置。
当:
mode = r,指针(光标)放在文本的最前面。可以从开始一个一个的读出来。
mode = a,指针(光标)放在文本的最后边。如果此时加一个可读的权限,能读出来什么呢?
tell() 可以告诉我,这个这个打开的文件的指针位置。
f = open('../tmp/test','a+')
print(f.tell())
print(f.writable())
print(f.read())
f.close()
##说明1:此处文本的内容为:i love python
##说明2:打开的文件使用完毕后必须第一时间调用close关闭。
14
True
3. seek()
seek() 英文意思:往或朝…而去,此处可以移动我们的指针(光标)。
seek(offest,[whence])
offest:偏移的字节量;
whence:从什么位置开始。
seek控制字节是很好使用的,但是文本模式下就很麻烦了。
文本模式下:
whence 0:缺省值,此时offest只能是正整数;
whence 1:表示当前位置开始,offest只能是0(毫无意义);
whence 2:表示从末尾开始,offest只能说0。
文本模式
f = open('../tmp/test','a+') #默认是文本模式
print(f.tell())
f.seek(1) #表示指针移到第二个字节开始的位置。
print(f.tell())
print(f.writable())
print(f.read())
f.close()
14
1
True
love python
字符模式
f = open('../tmp/test1','ab+') #b是bytes的缩写,字节模式
print(f.tell())
f.seek(-10,2) #从末尾位置向前移到10个字符,1表示当前位置,0是默认值,不能接受负数了。
print(f.tell())
print(f.read())
f.close()
##文件内容是:我爱python,向前移动10个字符。python\n是7个字符,爱是三个字符。
print(b'\xe7\x88\xb1'.decode())
##说明:二进制模式下,seek不允许向前超界,向后允许。
13
3
b'\xe7\x88\xb1python\n'
爱
4. buffering
buffering参数是写入文件时候的缓冲控制,文件写入的时候先保存到内存中,当存到一定的数量时候,就会写入硬盘。
缺省值是 -1。
二进制模式下,默认大小是4096或者8192个字节。
文本模式下,如果说终端设备,行缓存模式。非终端设备,使用二进制策略,一个汉字大多数算三个字符。
- buffering = 0 只在二进制模式下使用,关闭buffer;
- buffering = 1 只在文本模式下使用,表示开启行缓冲,见到换行符就保存(flush)到硬盘中;
- buffering > 1 用于指定buffer的大小。
# 查看默认的缓存区大小
import io
f = open('../tmp/test1','ab+')
print(io.DEFAULT_BUFFER_SIZE)
8192
注意:
- 文本模式,一般都使用默认缓冲区大小;
- 二进制模式,都是一个个字节的操作,可以指定buffer的大小;
- 一般来说,默认缓冲区大小说个比较好的选择,除非明确知道要干什么;
- 一般编程中,明知道需要写入磁盘,都会手动调用flush操作。
flush()
把缓存全部写入磁盘,调用close关闭文件时,会自动先执行一次flush再关闭文件。
2. write()
write(s)把字符串s写入到文件中保存并返回字符个数。
3. read()
read(size=-1)
size表示读取多少个字符(t模式)或者字节(b模式)出来,负数或者None表示从指针处全部读出。
f = open('../tmp/test1','r+') #b是bytes的缩写,字节模式
f.seek(6) #移动两个汉字,6个字符
print(f.read(6))
f.close()
#文本内容,我爱python
python
readline(size=-1)
使用一次读取一行的内容;
f = open('../tmp/test2','r+') #b是bytes的缩写,字节模式
print(f.readline())
print(f.readline())
f.close()
#文本内容:
# 我爱python
# i my mykernel
我爱python
i my mykernel
readlines(size=-1)
一次性读出所有的行,并以列表的形式输出;
f = open('../tmp/test2','r+') #b是bytes的缩写,字节模式
print(f.readlines())
f.close()
#文本内容:
# 我爱python
# i my mykernel
['我爱python\n', 'i my mykernel\n']
4. close()
close()
关闭打开中的文件,如果文件并未打开,调用了也不会产生异常。
5. 其他
seekable() 测试是否可seek
readable() 测试是否可读
writable() 测试是否可写
closed 测试是否已经关闭
f = open('../tmp/test2','r+') #b是bytes的缩写,字节模式
print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
print(f.readlines())
f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
True
True
False
['我爱python\n', 'i my mykernel\n']
True
f = open('../tmp/test2','r') #b是bytes的缩写,字节模式
print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
print(f.readlines())
f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
True
False
False
['我爱python\n', 'i my mykernel\n']
True
f = open('../tmp/test2','a') #b是bytes的缩写,字节模式
print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
False
True
False
True
更多欢迎访问:http://www.mykernel.cn/