原文链接
文件处理
1.打开文件
使用如下语法:
fileVariable = open(filename, mode)
filename指定一个文件,mode指定打开文件的方式,具体方式可选择下表中某一个:
模式 | 描述 |
---|---|
r | 为读取打开一个文件 |
w | 为写入打开一个文件,如果文件已经存在就会覆盖其内容,如果不存在就会创建文件 |
a | 打开一个文件从文件末尾追加数据 |
rb | 为读取二进制数据打开文件 |
wb | 为写入二进制数据打开文件 |
例如:
input = open(r"/home/usr/test.txt", "r")
2.写入数据
- 2.1 当使用open函数成功后就会创建一个文件对象(_io.TextIOWrapper类的实例),它包含了读写数据和关闭文件的方法,如下表:
_io.TextIOWrapper | |
---|---|
read([number.int]): str | 返回自定个数个字符,如果参数被忽略,那么读取文件中全部剩余的内容 |
readline(): str | 以字符串格式返回文件下一行 |
readlines(): list | 返回文件剩余行的列表 |
write(s: str): None | 向文件写入字符串 |
close(): None | 关闭文件 |
提示:我们知道当使用print()函数的时候,函数会在显示字符串后面自动添加一个换行符\n,但是这里的write函数不会自动添加换行符进来,所以当我么希望换行的时候,必须主动的给文件写入一个换行字符。
-
2.2 检测文件存在性
为了防止在当前目录下已经存在的文件被意外消除,在打开一个文件进行写操作前应该检测该文件是否已经存在。可以使用os.path模块中的isfile函数判断,当文件存在就会返回true, 例:
import os.path
if os.path.isfile("presidents.txt"):
print("文件已经存在")
- 2.3 从文件中读取所有数据
可以使用read()(返回字符串)或readlines()(返回字符串列表)读取文件的所有行,但是这比较适用于小文件,当文件过大的时候,无法全部存在存储器中。那么可以使用循环一次读取一行来进行读取。Python中允许使用for循环来读取文件所有行:
for line in infield:
例:将文件f1中的数据写入到f2中:
import os.path
import sys
def main():
f1 = input("请输入原文件:").strip()
f2 = input("请输入目标文件:").strip()
if os.path.isfile(f2):
print(f2 + "已经存在了")
sys.exit()
infile = open(f1, "r")
outfile = open(f2, "w")
countLines = countChars = 0
for line in infile:
countLines += 1
countChars += len(line)
outfile.write(line)
print(countLines, "lines and", countChars, "chars copied")
infile.close()
outfile.close()
main()
处理文件后记得关闭。
- 2.4 将数字写入文件
将数字写入文件需要先转换成字符串,然后使用write方法将它们写入文件。
3.文件对话框
关键点:tinter.filedialog模块中提供了askopenfilename和filesaveasfilename函数来显文件打开和保存为对话框。
例如:
from tkinter.filedialog import askopenfilename
from tkinter.filedialog import asksaveasfilename
filenameforReading = askopenfilename()
print("you can read from" + filenameforReading)
filenameforWriting = asksaveasfilename()
print("you can write data to " + filenameforWriting)
运行这段代码,askopenfilename()函数会显示选择文件的对话框:
asksaveasfilename()函数将显示保存为的对话框:
例子:
简单的文本编辑器:
from tkinter import *
from tkinter.filedialog import askopenfilename
from tkinter.filedialog import asksaveasfilename
class FileEditor:
def __init__(self):
window = Tk()
window.title("简单的编辑器")
menubar = Menu(window)
window.config(menu = menubar)
operationMenu = Menu(menubar, tearoff = 0)
menubar.add_cascade(label = "文件", menu = operationMenu)
operationMenu.add_command(label = "打开", command = self.openFile)
operationMenu.add_command(label = "保存", command = self.saveFile)
frame = Frame(window)
frame.grid(row = 1, column = 1)
scrollbar = Scrollbar(frame)
scrollbar.pack(side = RIGHT, fill = Y)
self.text = Text(frame, width = 40, height = 20, wrap = WORD, yscrollcommand = scrollbar.set)
self.text.pack()
scrollbar.config(command = self.text.yview)
window.mainloop()
def openFile(self):
filenameforfeading = askopenfilename()
infile = open(filenameforfeading, "r")
self.text.insert(END, infile.read())
infile.close()
def saveFile(self):
filenameforwriting = asksaveasfilename()
outfile = open(filenameforwriting, "w")
outfile.write(self.text.get(1.0, END))
outfile.close()
FileEditor()
当点击文件-打开的时候会让选择本地的文件,例子中是选择了test.py文件,然后可以选择文件-保存讲文件保存下来。如图:
从网站上获取数据
可以使用urllib.request模块中的urlopen函数打开一个统一资源定位器(URL)从网站上读取数据。然后使用decode函数将读取的比特形式的数据转换成字符串。这里的一个例子是计算一个网址的每个字母出现的次数:
import urllib.request
def main():
url = input("输入网址: ").strip() #例如https://www.baidu.com
infile = urllib.request.urlopen(url)
s = infile.read().decode()
counts = countLetters(s.lower())
for i in range(len(counts)):
if counts[i] != 0:
print(chr(ord('a') + i) + "出现" + str(counts[i]) + (" time" if counts[i] == 1 else " times"))
def countLetters(s):
counts = 26 * [0]
for ch in s:
if ch.isalpha():
counts[ord(ch) - ord('a')] += 1
return counts
main()
在例子中我们为了使urlopen识别一个有效的url,url地址需要有http://或https://前缀。如果没有就会出现异常。
异常处理
异常处理使程序能够处理异常然后继续它的正常执行。
上例中加入我们输入一个不存在的网址,就会抛出错误:
输入网址: www.baidu.com
Traceback (most recent call last):
File "/Users/sl/Desktop/StillClock.py", line 20, in <module>
main()
File "/Users/sl/Desktop/StillClock.py", line 5, in main
infile = urllib.request.urlopen(url)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 163, in urlopen
return opener.open(url, data, timeout)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 451, in open
req = Request(fullurl, data)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 269, in __init__
self.full_url = url
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 295, in full_url
self._parse()
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 324, in _parse
raise ValueError("unknown url type: %r" % self.full_url)
ValueError: unknown url type: 'www.baidu.com'
这个错误信息被称为堆栈回溯或回溯。回溯到导致这条语句错误的地方,错误信息会显示行号。如果发生错误,我们可以使用Python的异常处理语法来捕获这个错误并提示用户下一步操作。
try:
<body>
except <ExceptionType>:
<handler>
<body>包含可能包含异常的代码,当一个异常出现的时候,<body>中剩余的代码被跳过,如果该异常匹配一个异常类型,那么该类型下的处理代码会被执行。<handler>是处理异常的代码。
一个try语法可以有多个except子句来处理不同的异常。这个语句也可以选择else或finally语句,语法如下:
try:
<body>
except <ExceptionType1>:
<handler1>
...
except <ExceptionTypeN>:
<handlerN>
else:
<process_else>
finally:
<process_finally>
当出现异常的时候,按顺序检查是否匹配except子句后面的异常,如果找到一个匹配,就处理匹配的异常处理,其他的except子句部分就会被忽略。
如果出现异常,所列的异常类型都不匹配,就会执行最后一个except子句的处理。
如果没有出现异常就会执行else子句。
finally子句定义收尾动作,无论怎样都会执行。
使用异常对象处理异常
在except子句中,我们可以访问到这个异常的对象,可以使用如下语法将exception对象赋给一个变量:
try:
<body>
except <ExceptionType> as ex:
print("Exception:", ex)
抛出异常
一个异常的抛出是通过异常类实现的。首先创建一个异常对象,然后通过raise关键字将它抛出。
在程序中当我们希望抛出异常的地方(例如检测到数据不符合我们的需求时候),可以使用下面语法从一个正确的异常类创建一个对象并抛给函数调用者:
raise ExceptionClass("Something is wrong")
例如一个运行时的错误:
raise RuntimeError("错误请求")
自定义异常类
BaseException类是所有异常类的父类,所有的Python异常类都直接或间接地继承自BaseException类。所以我们可以直接或间接继承自BaseException类来自定义一个异常类。
例如:
class InvalidRadiusException(RuntimeError):
def __init__(self, radius):
super().__init__()
self.radius = radius
class Circle():
def __init__(self, radius):
self.setRadius(radius)
def getRadius(self):
return self.__radius
def setRadius(self, radius):
if radius >= 0:
self.__radius = radius
else:
raise InvalidRadiusException(radius)
def main():
try:
c1 = Circle(-5)
except InvalidRadiusException as ex:
print("半径是", ex.radius,"不合法")
except Exception:
print("一些异常")
else:
print("半径是", c1.getRadius())
main()
#结果:半径是 -5 不合法
使用Pickling进行二进制IO
加入往文件中写入像列表这样的任何一个对象,就需要使用二进制IO。这时候可以使用pickle模块中的dump和load函数进行二进制IO操作。
Python的pickle模块使用强大且有效的算法来序列化和反序列化对象。序列化是指将对象转换为一个能够存储一个文件中或网络上传输的字节流过程。反序列化指相反的过程,是从字节流中提取对象的过程。
如果不知道文件中有多少对象,可以使用load函数重复读取一个文件对象知道函数抛出一个EOFError异常(文件末尾)。