第十章(二)
2、写入文件
保存数据的最简单的方式之一是将其写入到文件中。
(1)写入空文件
要将文本写入文件,需要在调用open()时提供另一个参数,告诉Python你要写入打开的文件。
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.")
函数open()有两个实参,第一个是要打开的文件的名称;第二个是告诉Python,我们要以写入模式打开这个文件。打开文件时,可指定读取模式('r')、写入模式('w')、附加模式('a')或让你能够读取和写入文件的模式('r+')。如果你省略了模式实参,Python将以默认的只读模式打开文件。
如果你要写入的文件不存在,函数open()将自动创建它。然而,以写入('w')模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件,即先清空文件再执行写入操作。
注意:Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str()将其转换为字符串格式。
(2)写入多行
函数write()不会在你写入的文本末尾添加换行符。要让每个字符串都单独占一行,需要在write()语句中包含换行符:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love create new games.\n")
file_object.write("I love programming.\n")
# 文件中显示为:
I love create new games.
I love programming.
可以使用空格、制表符和空行来设置这些输出的格式。
(3)附加到文件
如果你要给文件添加内容,而不是覆盖原有的内容,可以附加模式打开文件。这时,Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加到文件末尾。如果指定的文件不存在,Python将会创建一个空文件。
filename = 'programming.txt'
with open(filename, 'a') as file_object:
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love create apps that can run in a browser.\n")
# 文件中显示为:
I love create new games.
I love programming.
I also love finding meaning in large datasets.
I love create apps that can run in a browser.
3、异常
Python使用被称为异常的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继续执行;如果你未对异常进行处理,程序将停止,并显示一个traceback,其中包含有关异常的报告。
异常是使用try-except代码块处理的。try-except代码块让Python执行指定的操作,同时告诉Python发生异常时怎么办。使用了try-except代码块,即便出现异常,程序也将继续运行:显示你编写的友好的错误信息,而不是令人迷惑的traceback。
(1)处理ZeroDivisionError异常
将一个数字除以0引发异常错误:
print(5/0)
# 报错提示:
ZeroDivisionError: division by zero
ZeroDivisionError是一个异常对象,在这种情况下,Python将停止运行程序,并指出引发了哪种异常。
(2)使用try-except代码块
当你认为可能发生了错误时,可编写一个try-except代码块来处理可能引发的异常。处理ZeroDivisionError异常的try-except代码块:
try:
print(5/0)
except ZeroDivisionError:
print("You can't divide by zero!")
# 输出:
You can't divide by zero!
如果try代码块中的代码运行起来没有问题,Python将跳过except代码块;如果try代码块中的代码导致了错误,Python将查找这样的except代码块,并运行其中的代码。
如果try-except代码块后面还有其他代码,程序将接着运行,因为已经告诉Python如何处理这种错误。
(3)使用异常避免崩溃
发生错误时,如果程序还有工作没完成,妥善地处理I错误尤为重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能在提示用户提供有效的输入,而不至于崩溃。下面是一个只执行除法运算的简单计算器:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Secong number: ")
if second_number == 'q':
break
answer = int(first_number) / int(second_number)
print(answer)
这个程序没有采取任何处理错误的措施,因此当除数为0时,它会崩溃。程序崩溃可不好,但让用户看到traceback也不是好主意。不懂技术的用户会被它们搞糊涂,而且如果用户怀有恶意,他会通过traceback获悉你不希望他知道的信息,尤其是训练有素的攻击者可以根据这些信息判断出可对你的代码发起什么样的攻击。
(4)else代码块
通过将可能引发错误的代码放在try-except代码块中,可提高这个程序的抵御错误的能力。错误是执行除法运算的代码行导致的,因此需要把该行代码放在try-except中。其次,还添加了一个else代码块,依赖于try代码块成功执行的代码都应放到else代码块中:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Secong number: ")
if second_number == 'q':
break
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
print("You can't divide by 0!")
else:
print(answer)
# 输出:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Secong number: 0
You can't divide by 0!
First number: q
try-except-else代码块的工作原理大致为:Python尝试执行try代码块中的代码;只有可能引发异常的代码才需要放在try语句中。有时候,有一些代码需要在try代码块成功运行后才运行,这些代码应放在else代码块中。except代码块告诉Python,如果它尝试运行try代码块中的代码时引发了指定的异常,该怎么办。
通过预测可能发生错误的的代码,可编写健壮的程序,它们即便面临无效数据或缺少资源,也能继续运行,从而能够抵御无意的用户错误和恶意的攻击。
(5)处理FileNotFoundError异常
使用文件时,当你找不到文件时,可使用try-except代码块以直观的方式进行处理。下面尝试读取一个不存在的文件:
filename = 'alice.txt'
with open(filename) as f_obj:
contents = f_obj.read()
# 报告异常:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
这里引发了FileNotFoundError异常,这是Python找不到要打开的文件时创建的异常。这个错误是open()函数导致的,因此要将该函数放在try代码块中。
filename = 'alice.txt'
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
# 输出:
Sorry, the file alice.txt does not exist.
(6)分析文本
你可以分析包含整本书的文本文件。项目Gutenberg(http://gutenberg.org/)提供了一系列不受版权限制的文学作品,如果你要在编程项目中使用文学文本,这是一个很不错的资源。
下面来提取一小段文本,并计算它包含多少个单词:
title = "Alice in Wonderland"
print(title.split())
# 输出:
['Alice', 'in', 'Wonderland']
方法split()以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中,结果是一个包含字符串中所有单词的列表,虽然有些单词可能包含标点。
下面计算Alice in Wonderland童话中包含多少个单词:
filename = 'alice.txt'
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
# 输出:
The file alice.txt has about 29461 words.
我们把相应的文件移到正确的目录下,让try代码块能够成功执行。
(7)使用多个文件
为了多分析几个文本文件,可以将上述代码的大部分移到一个函数中,这样调用起来更方便。
def count_words(filename):
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
filename = 'alice.txt'
count_words(filename)
有了这个函数,我们可以编写一个简单的循环,计算要分析的任何文本包含多少个单词。下面将要分析的文件存储在一个列表中,并对列表调用上述的函数进行计算:
def count_words(filename):
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
# 输出:
The file alice.txt has about 29461 words.
Sorry, the file siddhartha.txt does not exist.
The file moby_dick.txt has about 215136 words.
The file little_women.txt has about 189079 words.
注意:这里故意没把siddhartha.txt放在相应目录中,我们可以看到即使文件不存在,也不影响这个程序处理其他存在的文件。另外还可以避免让用户看到traceback。
(8)失败时一声不吭
程序捕获到异常时,如果你不希望将异常告诉用户,而是想什么都没发生一样继续运行,这时候将except代码块中的所有语句用一个pass语句来代替就可以了,表示什么都不用做,让程序顺利运行。这时的输出就不会有告诉你异常的那一句了,而其他的也能正常运行。
除此之外,pass语句还充当了占位符,它提醒你在程序的某个地方什么都没做,并且以后也许要在这里做些什么。
(9)决定报告哪些错误
向用户显示他不想看到的信息可能会降低程序的可用性。Python的错误处理结构让你能够细致地控制与用户分享错误信息的程度,要分享多少信息由你决定。
编写得很好且经过详尽测试的代码不容易出现内部错误,但只要程序依赖于外部因素,如用户输入、存在指定的文件、有网络链接,就有可能出现异常。凭借经验可判断该在程序的什么地方包含异常处理块,以及出现错误时该向用户提供多少相关的信息。
4、存储数据
使用模块json来存储数据。模块json让你能够将简单的Python数据结构存储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json模块在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,你可以以JSON格式存储的数据与使用其他编程语言的人分享。JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见格式,被包括Python在内的众多语言采用。
(1)使用json.dump()和json.load()
函数json.dump()接受两个实参:要存储的数据以及可用于存储数据的文件对象。
import json
numbers = [2, 3, 5, 7, 9, 11]
filename = 'numbers.json'
with open(filename,'w') as f_obj:
json.dump(numbers, f_obj)
通常使用文件扩展名.json来指出文件存储的数据为JSON格式。
函数json.load()可加载文件中的信息,并可存储在一个变量中。
import json
filename = 'numbers.json'
with open(filename) as f_obj:
numbers = json.load(f_obj)
print(numbers)
# 输出:
[2, 3, 5, 7, 9, 11]
可见,输出的列表与创建时的列表时一样的,这是一种再程序间共享数据的简单方式。
(2)保存和读取用户生成的数据
对于用户生成的数据,使用json保存它们大有裨益,因为如果不以某种方式进行存储,等程序停止运行时用户的信息将丢失。
接收用户名并保存:
import json
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
# 输出:
What is your name? Eric
We'll remember you when you come back, Eric!
读取信息:
import json
filename = 'username.json'
with open(filename) as f_obj:
username = json.load(f_obj)
print("Welcome back, " + username + "!")
# 输出:
Welcome back, Eric!
现在将两个程序合并到一个程序中。使得这个程序运行时,我们将尝试从文件中获取用户名,因此需要首先编写一个尝试恢复用户名的try代码块。如果这个文件不存在,我们就在except代码块中提示用户输入用户名,并将其存储在文件中,以便程序再次运行时能够获取它:
import json
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
username = input("What is your name? ")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username + "!")
无论执行的是except代码块还是else代码块,都将显示用户名和合适的问候语。如果这个程序是首次运行,将输出:
What is your name? Eric
We'll remember you when you come back, Eric!
否则,输出将如下:
Welcome back, Eric!
这是程序至少运行了一次时的输出。
(3)重构
代码能够正确地运行,但可做进一步的改进——将代码划分为一系列完成具体工作的函数。这样的过程被称为重构。重构让代码更清晰、更易于理解、更容易扩展。
要重构上述代码,可将其大部分逻辑放到一个或多个函数中。
import json
def greet_user():
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
username = input("What is your name? ")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username + "!")
greet_user()
下面对该函数进行重构,让它不执行这么多任务。先将获取存储的用户名的代码移到另一个函数中:
import json
def get_stored_username():
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
return None
else:
return username
def greet_user():
username = get_stored_username()
if username:
print("Welcome back, " + username + "!")
else:
filename = 'username.json'
username = input("What is your name? ")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
greet_user()
新增的函数目标明确,如果存储了用户名,这个函数就获取并返回它;如果文件不存在,就返回None。这种做法很好:函数要么返回预期的值,要么返回None;这让我们能够使用函数的返回值做简单的测试。
我们还可以将greet_user()中的另一个代码块提取出来。将没有存储用户名时提示用户输入的代码放在一个独立的函数中:
import json
def get_stored_username():
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
return None
else:
return username
def get_new_username():
filename = 'username.json'
username = input("What is your name? ")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
def greet_user():
username = get_stored_username()
if username:
print("Welcome back, " + username + "!")
else:
username = get_new_username()
print("We'll remember you when you come back, " + username + "!")
greet_user()
在这最终的版本中,每个函数都执行单一而清晰的任务。我们调用greet_user(),它打印一条合适的消息:要么欢迎老用户回来,要么问候新用户。为此,它首先调用get_stored_username(),这个函数只负责获取存储的用户名,再在必要时调用get_new_username(),这个函数只负责获取并存储新用户的用户名。要编写出清晰而易于维护和扩展的代码,这种划分工作必不可少。