今天我们来看一下文件的相关操作
一、文件的基础操作:
- 打开一个文件
f = file/open(<file-name>[, <open-style>])
- <file-name>:指的是文件路径
- <open-style>: 文件的打开方式, 如:
-
a
:表示追加(append); -
w
:如果文件不存在,那么就创建文件;如果文件存在,则会覆盖其中的原本存在的内容,这个时候无法读取; -
r
:默认情况是以只读的方式打开;
-
- 向文件末尾追加内容:
f.write(<content>)
- 从文件中读取内容:
f.read() f.readline() f.readlines() ...
- 判断是否读到最后一行:
len(f.readline()) == 0
- 判断是否读到最后一行:
- 刷新缓冲区:
f.flush()
- 执行flush的时候会将缓冲区的内容写入磁盘
- 关闭文件:
f.close()
- 文件关闭前,即使不去手动flush,也会将缓冲区的内容写入磁盘
- with语句:
with open("<file-name>") as file print(file.read())
- 使用with语句的时候不用手动调用close方法
- 在python中如果一个对象支持方法:
__enter__()
,__exit__()
,那么这个对象就是一个上下文管理器
,__exit__()
在执行结束的时候始终都会执行,相当于这个方法放在了finally中;
关于脚本文件头:
#!/usr/bin/env python
几种for循环读取文件的方式
- 直接使用for循环读取
file = open("test.txt") for line in file: print(line) file.close()
- for循环从打开的文件读取的时候,默认也是每次读取一行
- 直接使用for循环读取,同时读取行号
file = open("test.txt") for idx, line in enumrate(file): print(idx, line) file.close()
- 使用fileinput库
import fileinput for line in fileinput.input('input.txt', inplace=1): line = line.replace('<old-text>', '<new-text>') print(line,) file.close()
Python中对文件、文件夹的操作(来源)
(注:这个内容比较陈旧, 在新3.x版本中有的函数/方法已经废弃)
OS模块
- 得到当前工作目录,即当前Python脚本工作的目录路径:
os.getcwd()
- 返回指定目录下的所有文件和目录名:
os.listdir()
- 函数用来删除一个文件:
os.remove()
- 删除多个目录:
os.removedirs(<path>)
- 检验给出的路径是否是一个文件:
os.path.isfile()
- 检验给出的路径是否是一个目录:
os.path.isdir()
- 判断是否是绝对路径:
os.path.isabs()
- 检验给出的路径是否真地存:
os.path.exists()
- 返回一个路径的目录名和文件名:
os.path.split()
如:os.path.split('/home/swaroop/byte/code/poem.txt')
结果:('/home/swaroop/byte/code', 'poem.txt')
- 分离扩展名:
os.path.splitext()
- 获取路径名:
os.path.dirname()
- 获取文件名:
os.path.basename()
- 获取文件大小:
os.path.getsize(<file-name>)
- 运行shell命令:
os.system()
- 读取和设置环境变量:
os.getenv()
与os.putenv()
- 给出当前平台使用的行终止符:
os.linesep
Windows使用'\r\n'
,Linux使用'\n'
而Mac使用'\r'
- 指示你正在使用的平台:
os.name
,对于Windows,它是'nt'
,而对于Linux/Unix用户,它是'posix'
- 重命名:
os.rename(<old-name>, <new-name>)
- 创建多级目录:
os.makedirs(<path>)
- 创建单个目录:
os.mkdir(<dir-name>)
- 获取文件属性:
os.stat(<file-name>)
- 修改文件权限与时间戳:
os.chmod(<file-name>)
- 终止当前进程:
os.exit()
文件操作:
-
os.mknod(<filename>)
:创建空文件- os.mknod(<filename>[, mode=0600[, device=0]])
- <filename> -- 创建的文件系统节点
- mode -- mode指定创建或使用节点的权限, 组合 (或者bitwise) stat.S_IFREG, stat.S_IFCHR, stat.S_IFBLK, 和stat.S_IFIFO (这些常数在stat模块). 对于 stat.S_IFCHR和stat.S_IFBLK, 设备定义了 最新创建的设备特殊文件 (可能使用 os.makedev()),其它都将忽略。
- device -- 可选,指定创建文件的设备
- os.mknod(<filename>[, mode=0600[, device=0]])
-
fp = open("test.txt",w)
直接打开一个文件,如果文件不存在则创建文件- 关于open 模式:
w 以写方式打开, a 以追加模式打开 (从 EOF 开始, 文件不存在时创建新文件) r+ 以读写模式打开 w+ 以读写模式打开 (参见 w ) a+ 以读写模式打开 (参见 a ) rb 以二进制读模式打开 wb 以二进制写模式打开 (参见 w ) ab 以二进制追加模式打开 (参见 a ) rb+ 以二进制读写模式打开 (参见 r+ ) wb+ 以二进制读写模式打开 (参见 w+ ) ab+ 以二进制读写模式打开 (参见 a+ )
- 关于open 模式:
fp.read([size])
:size为读取的长度,以byte为单位fp.readline([size])
:读一行,如果定义了size,有可能返回的只是一行的一部分fp.readlines([size])
:把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。fp.write(str)
:把str写到文件中,write()并不会在str后加上一个换行符fp.writelines(seq)
:把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。fp.close()
:关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueErrorfp.flush()
:把缓冲区的内容写入硬盘fp.fileno()
:返回一个长整型的”文件标签“fp.isatty()
:文件是否是一个终端设备文件(unix系统中的)fp.tell()
:返回文件操作标记的当前位置,以文件的开头为原点fp.next()
:返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。fp.seek(offset[,whence])
:将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。fp.truncate([size])
:把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
目录操作:
-
os.mkdir(<file-name>)
:创建目录 - 复制文件:
shutil.copyfile(<old-file>,<new-file>)
:<old-file>和<new-file>都只能是文件
shutil.copy(<old-file>,<new-file>)
:<old-file>只能是文件夹,<new-file>可以是文件,也可以是目标目录 - 复制文件夹:
shutil.copytree(<old-dir>,<new-dir>)
:<old-dir>和<new-dir>都只能是目录,且<new-dir>必须不存在 - 重命名文件(目录)
os.rename(<old-name>, <new-name>)
:文件或目录都是使用这条命令 - 移动文件(目录)
shutil.move(<old-path>,<new-path>)
- 删除文件
os.remove(<file-name>)
- 删除目录
os.rmdir(<empty-dir-name>)
:只能删除空目录
shutil.rmtree(<dir-name>)
:空目录、有内容的目录都可以删 - 转换目录
os.chdir(<new-dir>)
:切换路径
相关例子
1 将文件夹下所有图片名称加上'_fc'
python代码:
# -*- coding:utf-8 -*-
import re
import os
import time
#str.split(string)分割字符串
#'连接符'.join(list) 将列表组成字符串
def change_name(path):
global i
if not os.path.isdir(path) and not os.path.isfile(path):
return False
if os.path.isfile(path):
file_path = os.path.split(path) #分割出目录与文件
lists = file_path[1].split('.') #分割出文件与文件扩展名
file_ext = lists[-1] #取出后缀名(列表切片操作)
img_ext = ['bmp','jpeg','gif','psd','png','jpg']
if file_ext in img_ext:
os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
i+=1 #注意这里的i是一个陷阱
#或者
#img_ext = 'bmp|jpeg|gif|psd|png|jpg'
#if file_ext in img_ext:
# print('ok---'+file_ext)
elif os.path.isdir(path):
for x in os.listdir(path):
change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
img_dir = 'D:\\xx\\xx\\images'
img_dir = img_dir.replace('\\','/')
start = time.time()
i = 0
change_name(img_dir)
c = time.time() - start
print('程序运行耗时:%0.2f'%(c))
print('总共处理了 %s 张图片'%(i))
输出结果:
程序运行耗时:0.11
总共处理了 109 张图片
shelve
- 利用shelve模块可以将程序中的数据保存到一个二进制文件中,下次运行的时候加载,如:配置数据
- 一个例子:
import shelve file = shelve.open('setting.dt') setting = {'color' : 'red', 'direction' : 'right', 'sorted' : 'true'} file['setting'] = setting file.close()
- 一个例子:
shutil ...
扩展知识:
-
shell输出添加颜色,参考自这里
\033[<bg-color>;<font-color>m<string-content>\033[0m
-
字背景颜色范围:40----49
40:黑 41:深红 42:绿 43:黄色 44:蓝色 45:紫色 46:深绿 47:白色
-
字颜色:30-----------39
30:黑 31:红 32:绿 33:黄 34:蓝色 35:紫色 36:深绿 37:白色
-
ANSI控制码的说明
\33[0m 关闭所有属性 \33[1m 设置高亮度 \33[4m 下划线 \33[5m 闪烁 \33[7m 反显 \33[8m 消隐 \33[30m -- \33[37m 设置前景色 \33[40m -- \33[47m 设置背景色 \33[nA 光标上移n行 \33[nB 光标下移n行 \33[nC 光标右移n行 \33[nD 光标左移n行 \33[y;xH设置光标位置 \33[2J 清屏 \33[K 清除从光标到行尾的内容 \33[s 保存光标位置 \33[u 恢复光标位置 \33[?25l 隐藏光标 \33[?25h 显示光标
二、魔术命令与文件读写的结合
- 把一段内容写入文件
%% writefile <file-name> <file-content-to-write>