10.1 从文件中读取数据
10.1.1 读取整个文件
创建一个文件pi_digits.txt,存储圆周率:
3.1415926535
8979323846
2643383279
下面的程序file_reader.py打开并读取这个文件,再将其内容显示到屏幕上:
filename = 'pi_digits.txt'
with open(filename) as file_object:
contents = file_object.read()
print(contents)
Python在当前执行的文件所在的目录中查找指定的文件。
函数open()返回一个表示文件的对象。
关键字with在不再需要访问文件后将其关闭。
方法read()读取文件的全部内容,返回字符串,read()到达文件末尾时返回一个空字符串,而将这个空字符串显示出来时就是一个空行。
要删除多出来的空行,可在函数调用print()中使用rstrip()。
10.1.2 文件路径
相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。
例如:目录a存在程序1.py,目录a\b存在文件2.txt,那么1.py要访问2.txt:b/2.txt
注意 显示文件路径时,Windows系统使用反斜杠(\)而不是斜杠(/),但在代码中依然可以使用斜杠。
绝对文件路径:文件在计算机中的准确位置。
注意 如果在文件路径中直接使用反斜杠,将引发错误,因为反斜杠用于对字符串中的字符进行转义。例如,对于路径"C:\path\to\file.txt",其中的\t将被解读为制表符。如果一定要使用反斜杠,可对路径中的每个反斜杠都进行转义,如"C:\\path\\to\\file.txt"。
10.1.3 逐行读取
filename = 'pi_digits.txt'
with open(filename) as file_object:
for line in file_object:
print(line.rstrip())
在这个文件中,每行的末尾都有一个看不见的换行符,所以在函数调用print()中使用rstrip()。
10.1.4 创建一个包含文件各行内容的列表
下面的示例在with代码块中将文件pi_digits.txt的各行存储在一个列表中,再在with代码块外打印:
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
for line in lines:
print(line.rstrip())
10.1.5 使用文件的内容
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.strip()
print(pi_string)
print(len(pi_string))
注意 读取文本文件时,Python将其中的所有文本都解读为字符串。如果读取的是数,并要将其作为数值使用,就必须使用函数int()将其转换为整数或使用函数float()将其转换为浮点数。
10.1.6 包含一百万位的大型文件
处理小数点后1 000 000位而不是30位的圆周率值,只打印到小数点后50位:
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.strip()
print(f"{pi_string[:52]}...")
print(len(pi_string))
注意 要运行这个程序(以及后面的众多示例),需要从http://ituring.cn/book/2784下载相关的资源。
10.1.7 圆周率值中包含你的生日吗
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.strip()
birthday = input("Enter your birthday, in the form mmddyy: ")
if birthday in pi_string:
print("Your birthday appears in the first million digits of pi!")
else:
print("Your birthday does not appear in the first million digits of pi.")
动手试一试
练习10-1:Python学习笔记
在文本编辑器中新建一个文件,写几句话来总结一下你至此学到的Python知识,其中每一行都以“In Python you can”打头。将这个文件命名为learning_python.txt,并存储到为完成本章练习而编写的程序所在的目录中。编写一个程序,它读取这个文件,并将你所写的内容打印三次:第一次打印时读取整个文件;第二次打印时遍历文件对象;第三次打印时将各行存储在一个列表中,再在with代码块外打印它们。
练习10-2:C语言学习笔记
可使用方法replace()将字符串中的特定单词都替换为另一个单词。下面是一个简单的示例,演示了如何将句子中的'dog'替换为'cat':

读取你刚创建的文件learning_python.txt中的每一行,将其中的Python都替换为另一门语言的名称,比如C。将修改后的各行都打印到屏幕上。
10.2 写入文件
10.2.1 写入空文件
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("以写模式写入文本数据.")
用记事本打开programming.txt,不会有乱码。
open函数的第二个实参('w')告诉Python,要以写入模式打开这个文件。打开文件时,可指定读取模式('r')、写入模式('w')、附加模式('a')或读写模式('r+')。如果省略了模式实参,Python将以默认的只读模式打开文件。
如果要写入的文件不存在,函数open()将自动创建它。
以写入模式('w')打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件的内容。
注意 Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str()将其转换为字符串格式。
10.2.2 写入多行
函数write()不会在写入的文本末尾添加换行符,要让每个字符串都单独占一行,需要在方法调用write()中包含换行符:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love creating apps that can run in a browser.\n")
像显示到终端的输出一样,还可以使用空格、制表符和空行来设置这些输出的格式。
10.2.3 附加到文件
如果要给文件添加内容,而不是覆盖原有的内容,可以以附加模式打开文件,将写入文件的行添加到文件末尾。
如果指定的文件不存在,Python将为你创建一个空文件。
filename = 'programming.txt'
with open(filename, 'a') as file_object:
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love creating apps that can run in a browser.\n")
打开文件时指定了实参'a'。
动手试一试
练习10-3:访客
编写一个程序,提示用户输入名字。用户做出响应后,将其名字写入文件guest.txt中。
练习10-4:访客名单
编写一个while循环,提示用户输入名字。用户输入名字后,在屏幕上打印一句问候语,并将一条到访记录添加到文件guest_book.txt中。确保这个文件中的每条记录都独占一行。
练习10-5:调查
编写一个while循环,询问用户为何喜欢编程。每当用户输入一个原因后,都将其添加到一个存储所有原因的文件中。
10.3 异常
每当发生让Python不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继续运行;如果未对异常进行处理,程序将停止并显示traceback,其中包含有关异常的报告。
异常是使用try-except代码块处理的。
10.3.1 引发ZeroDivisionError异常
除数为0时导致python引发异常:
print(5/0)
结果:
Traceback (most recent call last):
File "E:\。。。\a.py", line 1, in <module>
print(5/0)
ZeroDivisionError: division by zero
ZeroDivisionError指出了异常对象的类型。
10.3.2 使用try-except代码块处理异常
try:
print(5/0)
except ZeroDivisionError:
print('除数不能为0!')
结果:除数不能为0!
将导致错误的代码行print(5/0)放在一个try代码块中。如果try代码块中的代码运行起来没有问题,Python将跳过except代码块;如果try代码块中的代码导致了错误,Python将查找与这个错误匹配的except代码块并运行其中的代码。
10.3.3 没有自己处理异常导致程序崩溃
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
if second_number == 'q':
break
answer = int(first_number) / int(second_number)
print(answer)
10.3.4 else代码块
依赖try代码块成功执行的代码都应放到else代码块中:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
if second_number == 'q':
break
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
print("You can't divide by 0!")
else:
print(answer)
try代码块只包含可能导致错误的代码。
except代码块可以打印一条友好的消息,告诉用户如何避免这种错误。
10.3.5 处理FileNotFoundError异常
下面的程序尝试读取文件alice.txt的内容,但该文件没有存储在alice.py所在的目录中:
filename = 'alice.txt'
with open(filename, encoding='utf-8') as f:
contents = f.read()
给参数encoding指定了值,在系统的默认编码与要读取文件使用的编码不一致时,必须这样做。
结果:
Traceback (most recent call last):
File "E:\。。。\a.py", line 3, in <module>
with open(filename, encoding='utf-8') as f:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
处理异常:
filename = 'alice.txt'
try:
with open(filename, encoding='utf-8') as f:
contents = f.read()
except FileNotFoundError:
print(f"对不起, {filename} 这个文件不存在.")
10.3.6 分析文本
字符串方法split()以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中。
将文件alice.txt移到正确的目录, 计算《爱丽丝漫游奇境记》包含多少个单词:
filename = 'alice.txt'
try:
with open(filename, encoding='utf-8') as f:
contents = f.read()
except FileNotFoundError:
print(f"Sorry, the file {filename} does not exist.")
else:
# Count the approximate number of words in the file.
words = contents.split()
num_words = len(words)
print(f"The file {filename} has about {num_words} words.")
10.3.7 使用多个文件
先将上面这个程序的大部分代码移到一个名为count_words()的函数,再编写一个简单的循环,计算每本书包含大约多少个单词:
def count_words(filename):
"""Count the approximate number of words in a file."""
try:
with open(filename, encoding='utf-8') as f:
contents = f.read()
except FileNotFoundError:
print(f"对不起, {filename} 这个文件不存在.")
else:
words = contents.split()
num_words = len(words)
print(f"The file {filename} has about {num_words} words.")
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
文件siddhartha.txt不存在,但这丝毫不影响该程序处理其他文件:
The file alice.txt has about 29465 words.
对不起, siddhartha.txt 这个文件不存在.
The file moby_dick.txt has about 215830 words.
The file little_women.txt has about 189079 words.
在本例中,使用try-except代码块提供了两个重要的优点:避免用户看到traceback,以及让程序继续分析能够找到的其他文件。
10.3.8 静默失败
并非每次捕获到异常都需要告诉用户,有时候你希望程序在发生异常时保持静默,就像什么都没有发生一样继续运行。
静默失败:
except FileNotFoundError:
pass #让Python在代码块中什么都不要做
pass语句还充当了占位符,提醒你在程序的某个地方什么都没有做,并且以后也许要在这里做些什么。
10.3.9 决定报告哪些错误
向用户显示他不想看到的信息可能会降低程序的可用性。
只要程序依赖于外部因素,如用户输入、存在指定的文件、有网络链接,就有可能出现异常。
凭借经验可判断该在程序的什么地方包含异常处理块,以及出现错误时该向用户提供多少相关的信息。
动手试一试
练习10-6:加法运算 提示用户提供数值输入时,常出现的一个问题是,用户提供的是文本而不是数。在此情况下,当你尝试将输入转换为整数时,将引发ValueError异常。编写一个程序,提示用户输入两个数,再将其相加并打印结果。在用户输入的任何一个值不是数时都捕获ValueError异常,并打印一条友好的错误消息。对你编写的程序进行测试:先输入两个数,再输入一些文本而不是数。
练习10-7:加法计算器 将为完成练习10-6而编写的代码放在一个while循环中,让用户犯错(输入的是文本而不是数)后能够继续输入数。
练习10-8:猫和狗 创建文件cats.txt和dogs.txt,在第一个文件中至少存储三只猫的名字,在第二个文件中至少存储三条狗的名字。编写一个程序,尝试读取这些文件,并将其内容打印到屏幕上。将这些代码放在一个try-except代码块中,以便在文件不存在时捕获FileNotFound错误,并显示一条友好的消息。将任意一个文件移到另一个地方,并确认except代码块中的代码将正确执行。
练习10-9:静默的猫和狗 修改你在练习10-8中编写的except代码块,让程序在任意文件不存在时静默失败。
练习10-10:常见单词 访问古登堡计划,找一些你想分析的图书。下载这些作品的文本文件或将浏览器中的原始文本复制到文本文件中。可以使用方法count()来确定特定的单词或短语在字符串中出现了多少次。例如,下面的代码计算'row'在一个字符串中出现了多少次:

请注意,通过使用lower()将字符串转换为小写,可捕捉要查找单词的所有格式,而不管其大小写如何。
编写一个程序,它读取你在古登堡计划中获取的文件,并计算单词'the'在每个文件中分别出现了多少次。这里计算得到的结果并不准确,因为将诸如'then'和'there'等单词也计算在内了。请尝试计算'the '(包含空格)出现的次数,看看结果相差多少。
10.4 存储数据
模块json让你能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便而有用的格式,也易于学习。
注意 JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见格式,被包括Python在内的众多语言采用。
10.4.1 使用json.dump()和json.load()
下面演示了如何使用json.dump()来存储数字列表:
import json
numbers = [2, 3, 5, 7, 11, 13]
filename = 'numbers.json'
with open(filename, 'w') as f:
json.dump(numbers, f)
通常使用文件扩展名.json来指出文件存储的数据为JSON格式。
下面再编写一个程序,使用json.load()将列表读取到内存中:
import json
filename = 'numbers.json'
with open(filename) as f:
numbers = json.load(f)
print(numbers)
这是一种在程序之间共享数据的简单方式。
10.4.2 保存和读取用户生成的数据
下面来看一个这样的例子:提示用户首次运行程序时输入自己的名字,并在再次运行程序时记住他。
先来存储用户的名字:
remember_me.py
"""存储姓名"""
import json
username = input("叫什么名字?")
filename = 'username.json'
with open(filename,'w') as f:
json.dump(username,f)
print(f"We'll remember you when you come back, {username}!")
现在再编写一个程序,向已存储了名字的用户发出问候:
greet_user.py
import json
filename = 'username.json'
with open(filename) as f:
username = json.load(f)
print(f"Welcome back, {username}!")
合并程序:
remember_me.py
import json
"""
试图从username.json文件中获取用户名,
如果文件不存在,提示用户输入用户名并存储它,
否则输出”xxx,欢迎你回来“。
"""
filename = 'username.json'
try:
with open(filename) as f:
username = json.load(f)
except FileNotFoundError:
"""Prompt for a new username."""
username = input("What is your name? ")
with open(filename, 'w') as f:
json.dump(username, f)
print(f"We'll remember you when you come back, {username}!")
else:
print(f"Welcome back, {username}!")
无论执行的是except还是else代码块,都将显示用户名和合适的问候语。
10.4.3 重构
代码能够正确地运行,但通过将其划分为一系列完成具体工作的函数,还可以改进。这样的过程称为重构。
remember_me.py的重点是问候用户,因此将其所有代码都放到一个名为greet_user()的函数中:
import json
def greet_user():
"""
试图从username.json文件中获取用户名,
如果文件不存在,提示用户输入用户名并存储它,
否则输出”xxx,欢迎你回来“。
"""
filename = 'username.json'
try:
with open(filename) as f:
username = json.load(f)
except FileNotFoundError:
"""Prompt for a new username."""
username = input("What is your name? ")
with open(filename, 'w') as f:
json.dump(username, f)
print(f"We'll remember you when you come back, {username}!")
else:
print(f"Welcome back, {username}!")
greet_user()
下面来重构greet_user(),减少其任务。为此,首先将获取已存储用户名的代码移到另一个函数中:
import json
filename = 'username.json'
def get_stored_username():
"""
试图从username.json文件中获取用户名,
如果文件不存在,返回None,
否则返回用户名。
"""
try:
with open(filename) as f:
username = json.load(f)
except FileNotFoundError:
return None
else:
return username
def greet_user():
"""
试图从username.json文件中获取用户名,
如果文件不存在,提示用户输入用户名并存储它,
否则输出”xxx,欢迎你回来“。
"""
username = get_stored_username()
if username:
print(f"Welcome back, {username}!")
else:
"""Prompt for a new username."""
username = input("What is your name? ")
with open(filename, 'w') as f:
json.dump(username, f)
print(f"We'll remember you when you come back, {username}!")
greet_user()
这是一种不错的做法:函数要么返回预期的值,要么返回None。
还需要重构greet_user()中的另一个代码块,将没有存储用户名时提示用户输入的代码放在一个独立的函数中:
import json
filename = 'username.json'
def get_stored_username():
"""
试图从username.json文件中获取用户名,
如果文件不存在,返回None,
否则返回用户名。
"""
try:
with open(filename) as f:
username = json.load(f)
except FileNotFoundError:
return None
else:
return username
def get_new_username():
"""Prompt for a new username."""
username = input("What is your name? ")
with open(filename, 'w') as f:
json.dump(username, f)
return username
def greet_user():
"""
试图从username.json文件中获取用户名,
如果文件不存在,提示用户输入用户名并存储它,
否则输出”xxx,欢迎你回来“。
"""
username = get_stored_username()
if username:
print(f"Welcome back, {username}!")
else:
username = get_new_username()
print(f"We'll remember you when you come back, {username}!")
greet_user()
我们调用greet_user(),它打印一条合适的消息:要么欢迎老用户回来,要么问候新用户。
动手试一试
练习10-11:喜欢的数 编写一个程序,提示用户输入喜欢的数,并使用json.dump()将这个数存储到文件中。再编写一个程序,从文件中读取这个值,并打印如下所示的消息。I know your favorite number! It's _____.
练习10-12:记住喜欢的数 将练习10-11中的程序合二为一。如果存储了用户喜欢的数,就向用户显示它,否则提示用户输入喜欢的数并将其存储到文件中。运行这个程序两次,看看它能否像预期的那样工作。
练习10-13:验证用户 最后一个remember_me.py版本假设用户要么已输入用户名,要么是首次运行该程序。我们应该修改这个程序,以防当前用户并非上次运行该程序的用户。为此,在greet_user()中打印欢迎用户回来的消息前,询问他用户名是否正确。如果不对,就调用get_new_username()让用户输入正确的用户名。
10.5 小结
在本章中,你学习了:如何使用文件;如何一次性读取整个文件,以及如何以每次一行的方式读取文件的内容;如何写入文件,以及如何将文本附加到文件末尾;什么是异常以及如何处理程序可能引发的异常;如何存储json数据结构,以保存用户提供的信息,避免用户每次运行程序时都需要重新提供。
本文介绍了Python中文件的读写操作,包括从头读取、路径管理、逐行读取和大型文件处理,以及异常处理的基础知识,如ZeroDivisionError和使用try-except。此外,还涉及JSON数据存储和基本的文件错误处理技巧。
6678

被折叠的 条评论
为什么被折叠?



