字符串转换:
- str(): 函数返回一个用户易读的表达形式。
- repr(): 产生一个解释器易读的表达形式。
其中,repr() 函数可以转义字符串中的特殊字符,参数可以是 Python 的任何对象。
content = '123\n4567\n89100'
print(str(content))
print(repr(content))
123
4567
89100
'123\n4567\n89100'
文件对象方法
- f.read()
- f.readline()
- f.readlines()
- f.write()
- f.tell()
- f.seek()
- f.close()
f.tell()
f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。
f.seek
如果要改变文件当前的位置, 可以使用 f.seek(offset, from_what) 函数。
from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:
- seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
- seek(x,1) : 表示从当前位置往后移动x个字符
- seek(-x,2):表示从文件的结尾往前移动x个字符
from_what 值为默认为0,即文件开头。
path = 'data.txt'
content = '123\n4567\n89100'
# 写文件
with open(path, 'w') as f:
f.write(content) # 返回14 ('\n'算一个字符)
# 读文件,并在最后重复追加
with open(path, 'r+') as f:
# f(tell)=0
content = f.read() # 读
# f(tell)=16 ('\n'算两个)
f.write(content) # 追加
print(content)
123
4567
89100
# 读文件
with open(path, 'r') as f:
print(f.read())
123
4567
89100123
4567
89100
# 从中间开始读
with open(path, 'r') as f:
f.seek(16, 0)
print(f.read())
123
4567
89100
如何选择文件打开的模式?(二进制读写加b)
使用 json 保存结构化数据
因为read()
方法只能返回字符串,如果想要保存复杂的数据结构,那么手动解析和序列化会变得复杂。
名为
json
的标准模块可以采用 Python 数据层次结构,并将它们转化为字符串表示形式;这个过程称为 serializing 。从字符串表示中重建数据称为 deserializing 。在序列化和反序列化之间,表示对象的字符串可能已存储在文件或数据中,或通过网络连接发送到某个远程机器。Python文档
json
模块常用的四个函数:
import json
json.load(f) # 将一个存储在文件中的json对象(str)转化为相对应的python对象
json.loads() # 将一个json对象(str)转化为相对应的python对象
json.dump(x, f) # 将python的对象转化为对应的json对象(str),并存放在文件中
json.dumps() # 将python的对象转化为对应的json对象(str)
使用json
时遇到过的问题:
f = open('data.txt', 'r')
x = json.load(f) # 错误!
print(x)
f.close()
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
问题在于文件不符合json
类型(如:.txt),
以后在使用json
前最好先前查一下参数的格式。
- dump(x, f):
import json
x = [1, '2', 3]
f = open('data.json', 'w')
json.dump(x, f)
f.close()
- load(f):
f = open('data.json', 'r')
x = json.load(f)
f.close()
print(x) # [1, '2', 3]
遇到的一些问题
因为json只能读取一个文档对象,给出两个解决办法:
1、单行读取文件,一次读取一行文件。
2、保存数据源的时候,格式写为一个对象。
with open(filename) as f:
for line in f: # for line in f.readlines():
print(json.loads(line))
pickle 模块
python的pickle模块实现了基本的数据序列和反序列化。
通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储。
通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。(从 file 中读取一个字符串,并将它重构为原来的python对象。)
基本接口:
pickle.dump(obj, file, [,protocol])
x = pickle.load(file)
import pickle
# 使用pickle模块将数据对象保存到文件
data1 = {'a': [1, 2.0, 3, 4+6j],
'b': ('string', u'Unicode string'),
'c': None}
selfref_list = [1, 2, 3]
selfref_list.append(selfref_list)
output = open('data.pkl', 'wb')
# Pickle dictionary using protocol 0.
pickle.dump(data1, output)
# Pickle the list using the highest protocol available.
pickle.dump(selfref_list, output, -1)
output.close()
import pprint, pickle
# pprint模块用于美化打印
#使用pickle模块从文件中重构python对象
pkl_file = open('data.pkl', 'rb')
data1 = pickle.load(pkl_file)
pprint.pprint(data1)
data2 = pickle.load(pkl_file)
pprint.pprint(data2)
pkl_file.close()
{'a': [1, 2.0, 3, (4+6j)], 'b': ('string', 'Unicode string'), 'c': None}
[1, 2, 3, <Recursion on list with id=58569064>]