文件基本操作(承接上文)
上下文管理
with:有自动关闭文件的机制,可以避免打开文件而忘记关闭的情况
with open(r'C:\Users\dingcong\Desktop\密码.txt', mode='r') as f:
date = f.read()
print(date)
文件打开模式:rwa、bt
控制文件读写操作的模式
r(默认):只读模式,以该模式打开文件,当文件不存在时:报错,当文件存在时,文件指针在文件开头。
f.readable():判读文件是否可读
f.readline():只读一行,可以一行行读文本,当文件指针读到末尾是则读出为空(for line in f:……print(line))
with open(r'C:\Users\Jason\Desktop\py.txt', mode='rt') as f:
for line in f:
print(line)
理解:文本文件中,以换行符将内容划分为多个数据,所以for循环可以进行迭代循环。
f.readlines():读出文件形成列表形式
w:只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头。
在打开文件不关闭的情况下,连续的写入,新写的内容总时跟在老内容之后。
f.writable():判断文件是否可写
f.write():在文件内写入内容
f.writelines():
f.write和f.writelines的区别:
file.write(str)的参数是一个字符串,就是你要写入文件的内容.
file.writelines(sequence)的参数是序列,比如列表,它会迭代帮你写入文件。
a:只追加写模式,当文件不存在时创建文件,当文件文件存在时追加内容。(以该模式打开文件,指针直接跳到文件末尾)
控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)
t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数。
b:无论读写都是bytes为单位的,可以操作所有文件,一定不能指定encoding参数。
了解:
+:不能单独使用:必须与rwa连用,r+、w+、a+
文件修改的两种方式
方式一:
以读的方式打开源文件
将文件内容一次性读入内存,在内存完成修改
以写的方式打开源文件,然后将修改后的结果一次性屑放入源文件
优点:在文件修改过程中,硬盘只存在一份数据
缺点:浪费内存
with open('b.txt',mode='rt',encoding='utf-8') as f1:
msg=f1.read()
new_msg=msg.replace('alex','大SB')
with open('b.txt',mode='wt',encoding='utf-8') as f2:
f2.write(new_msg)
方式二:
以读的方式打开源文件,以写的方式打开一个临时文件
读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环执行。
删除源文件,将临时文件重命名为原文件名。
优点:同一时间内在内存中只有文件的一行内容,更节省空间
缺点:在文件修改的过程中硬盘只存在两分数据
import os
with open('b.txt',mode='rt',encoding='utf-8') as read_f,\
open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
for line in read_f:
write_f.write(line.replace('大SB','alex'))
os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')
文件内指针移动:f.seek()
强调:只有t模式下read(n),n代表字符的个数,除此以外都是以字节为单位。
"""
文件内容:哈哈哈哈
呵呵呵呵
"""
with open(r'C:\Users\test.txt', mode='rt', encoding='utf-8') as f:
res = f.read(4)
print(res)
哈哈哈哈
f.truncate(size):从文件的首行首字符开始截断,截断文件为 size 个字节,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字节大小
with open(r'C:\Users\test.txt', mode='at', encoding='utf-8') as f:
f.truncate(3)
f.seek(offset,whence):指针移动是以字节为单位的
offset:开始的偏移量,也就是代表需要移动偏移的字节数
whence:可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。
三种模式:只有0模式下既可以在t下用也可以在b模式下用,而1、2两种模式只能在b模式下用。
0(默认):参照文件开头
with open(r'C:\Users\test.txt',mode='rt',encoding='utf-8') as f:
f.seek(3,0) # offset:3字节;whence:0
print(f.tell()) # 查看文件指针位置
print(f.read())
1:参照指针当前所在位置
with open(r'C:\Users\test.txt', mode='rb') as f:
f.read(2) # 文件指针读到第二字节
f.seek(4, 1) # 从指针当前位置再往右移动4字节
print(f.tell())
print(f.read().decode('utf-8')) # b模式下,将读出的二进制码进行解码。
# 注:当指针移动到某字符中间位置时,打印内容会报错
2:参照文件文件末尾
with open(r'C:\Users\test.txt',mode='rb') as f:
f.seek(-5, 2) #从文件末尾操作指针时,往前操作注意偏移量为负数
print(f.tell())
print(f.read().decode('utf-8'))
# 注:当指针移动到某字符中间位置时,打印内容会报错