学习处理文件和保存数据可以使程序使用起来更容易,用户将能够选择输入什么样的数据, 以及在什么时候输入; 用户使用你的程序做一些工作后, 可将程序关闭, 以后再接着往下做。
从文件中读取数据
文本文件可存储的数据量多得难以置信: 天气数据、 交通数据、 社会经济数据、 文学作品等。 每当需要分析或修改存储在文件中的信息时, 读取文件都很有用, 对数据分析应用
程序来说尤其如此。 例如, 你可以编写一个这样的程序: 读取一个文本文件的内容, 重新设置这些数据的格式并将其写入文件, 让浏览器能够显示这些内容。
要使用文本文件中的信息, 首先需要将信息读取到内存中。 为此, 你可以一次性读取文件的全部内容, 也可以以每次一行的方式逐步读取。
不同模式打开文件的完全列表:
模式描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。
1.1文件操作介绍
1.1.1什么是文件
1.1.2文件的作用
大家应该听说过一句话:“好记性不如烂笔头”。
不仅人的大脑会遗忘事情,计算机也会如此,比如一个程序在运行过程中用了九牛二虎之力终于计算出了结果,试想一下如果不把这些数据存放起来,相比重启电脑之后,“哭都没地方哭了”
可见,在把数据存储起来有做么大的价值
使用文件的目的:
就是把一些存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省力
1.2文件的打开与关闭
想一想:
如果想用word编写一份简历,应该有哪些流程呢?
1.打开word软件,新建一个word文件
2.写入个人简历信息
3.保存文件
4.关闭word软件
同样,在操作文件的整体过程与使用word编写一份简历的过程是很相似的
1.打开文件,或者新建立一个文件
2.读/写数据
3.关闭文件
1.2.1打开文件
在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件
open(文件名,访问模式)
示例如下:
f = open('test.txt','w')
说明:
1.2.2关闭文件
close( )
示例如下:
#新建一个文件,文件名为:test.txt
f = open('test.txt','w')
#关闭这个文件
f.close()
1.2.3路径
1.2.3.1linux
1.2.3.2windows
1.3文件的读写
1.3.1写数据(write)
使用write()可以完成向文件写入数据
demo:
f = open('test.txt','w')
f.write('hello world, i am here!')
f.close()
注意:
·如果文件不存在那么创建,如果存在那么就先清空,然后写入数据
1.3.2读数据(read)
使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据
demo:
f = open('test.txt','r')
content = f.read(5)
print(content)
print("-"*30)
content = f.read()
print(content)
f.close()
注意:
·如果open是打开一个文件,那么可以不用谢打开的模式,即只写open('test.txt')
·如果使用读了多次,那么后面读取的数据是从上次读完后的位置开始的
1.3.3读数据(readlines)
就像read没有参数时一样,readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
f = open('test.txt','r')
content = f.readlines()
print(type(content))
i=1
fortempincontent:
print("%d:%s"%(i, temp))
i+=1
f.close()
1.3.4读数据(readline)
f = open('test.txt','r')
content = f.readline()
print("1:%s"%content)
content = f.readline()
print("2:%s"%content)
f.close()
想一想:
如果一个文件很大,比如5G,试想应该怎样把文件的数据读取到内存然后进行处理呢?
1.4应用1:制作文件的备份
任务描述:
输入文件的名字,然后程序自动完成对文件进行备份
参考代码:
oldFileName = input("请输入要拷贝的文件名字:")
oldFile = open(oldFileName,'r')
#如果打开文件
ifoldFile:
#提取文件的后缀
fileFlagNum = oldFileName.rfind('.')
iffileFlagNum >0:
fileFlag = oldFileName[fileFlagNum:]
#组织新的文件名字
newFileName = oldFileName[:fileFlagNum] +'[复件]'+ fileFlag
#创建新文件
newFile = open(newFileName,'w')
#把旧文件中的数据,一行一行的进行复制到新文件中
forlineContentinoldFile.readlines():
newFile.write(lineContent)
#关闭文件
oldFile.close()
newFile.close()
1.5文件的随机读写
1.5.1获取当前读写的位置
在读写文件的过程中,如果想知道当前的位置,可以使用tell()来获取
从0开始到字符的个数
#打开一个已经存在的文件
f = open("test.txt","r")
str = f.read(3)
print("读取的数据是: ", str)
#查找当前位置
position = f.tell()
print("当前文件位置: ", position)
str = f.read(3)
print("读取的数据是: ", str)
#查找当前位置
position = f.tell()
print("当前文件位置: ", position)
f.close()
1.5.2定位到某个位置
如果在读写文件的过程中,需要从另外一个位置进行操作的话,可以使用seek()
seek(offset, from)有2个参数
1.offset:偏移量
2.from:方向
a)0:表示文件开头(python3)
b)1:表示当前位置(python2)
c)2:表示文件末尾(python2)
demo:把位置设置为:从文件开头,偏移5个字节
#打开一个已经存在的文件
f = open("test.txt","r")
str = f.read(30)
print("读取的数据是: ", str)
#查找当前位置
position = f.tell()
print("当前文件位置: ", position)
#重新设置位置
f.seek(5,0)
#查找当前位置
position = f.tell()
print("当前文件位置: ", position)
f.close()
demo:把位置设置为:离文件末尾,3字节处
#打开一个已经存在的文件
f = open("test.txt","r")
#查找当前位置
position = f.tell()
print("当前文件位置: ", position)
#重新设置位置
f.seek(-3,2)
#读取到的数据为:文件最后3个字节数据
str = f.read()
print("读取的数据是: ", str)
f.close()
1.6文件的重命名、删除
有些时候,需要对文件进行重命名、删除等一些操作,python的os模块中都有这么功能
1.6.1文件重命名
os模块中的rename()可以完成对文件的重命名操作
rename(需要修改的文件名,新的文件名)
importos
os.rename("毕业论文.txt","毕业论文-最终版.txt")
1.6.2删除文件
os模块中的remove()可以完成对文件的删除操作
remove(待删除的文件名)
importos
os.remove("毕业论文.txt")
1.7文件夹的相关操作
实际开发中,有时需要用程序的方式对文件夹进行一定的操作,比如创建、删除等
就像对文件操作需要os模块一样,如果要操作文件夹,同样需要os模块
1.7.1创建文件夹
importos
os.mkdir("张三")
os.makedirs(‘m/n’)
1.7.2获取当前目录
importos
os.getcwd()
1.7.3改变默认目录
importos
os.chdir("../")
1.7.4获取目录列表
importos
os.listdir("./")
1.7.5删除文件夹
importos
os.rmdir("张三")
import shutil
os.rmtree(‘m’)
1.8应用2:批量修改文件名
import os
#得到完整路径
dir = input('输入完整的路径:')
#获取此路径下的列表
all_file = os.listdir(dir)
#改变当前的工作路径
os.chdir(dir)
#遍历
for i in all_file:
#处理名字
new_name = i[:i.index('.')] + '-new' + i[i.index('.'):]
#重命名
os.rename(i, new_name)