简介
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,是ECMAScript的一个子集。常用于web应用中作为对象的序列化,也经常作为配置文件存在(替换INI配置文件),json格式更易于人理解。
在python语言中有专门的标准库--JSON对这种格式数据进行操作
JSON库
JSON库提供的接口很简单,类似python的序列化库marshal
和pickle
。常用的API只有两种:序列化接口和反序列化接口
序列化接口
序列化就是将python的对象转换成json格式
- 对象类型转换表
python | json |
---|---|
dict | object |
list、tuple | array |
str | string |
int、float、枚举 | number |
True/False | true/false |
None | null |
-
dump
接口
json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)
此接口可以将obj进行序列化,并存放在fp中,而fp是支持write
的file类型,可以是文件或者流(像socket、stdout等)
例如:
import json
data = [1, 'a', {'b': (1.0, 'c')}]
with open("test.json", "w") as f:
json.dump(data, f)
-
dumps
接口
json.dumps(obj, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)
将obj 序列化为 JSON 格式的 str
。 其参数的含义与 dump()
中的相同。
import json
data = [1, 'a', {'b': (1.0, 'c')}]
data1 = json.dumps(data)
print(data1)
反序列化
反序列化就是将json格式文件或者字符串转换成python对象
- 类型对象转换表
json | python |
---|---|
object | dict |
array | list |
string | str |
number(int) | int |
number(float) | float |
true/false | True/False |
null | None |
-
load
接口
json.load(fp, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
与dump
接口的动作相反。此接口将fp中存放的json格式数据转换为python对象
例如:
import json
data = [1, 'a', {'b': (1.0, 'c')}]
with open("test.json", "w") as f:
json.dump(data, f)
with open("test.json", "r") as fp:
data2 = json.load(fp)
print(data2)
如果json文件中有中文字符,
load
时会报错误UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position XXX: illegal multibyte sequence
,只需要在open时增加encoding
参数即可,如下
with open("test.json", "r", encoding="utf-8") as fp:
-
loads
接口
json.loads(s, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
与dumps
接口动作相反,此接口将一个json格式字符串反序列化为python对象
异常
与json相关的异常一般出现在反序列化时,当json格式不合法时出现
exception json.JSONDecodeError(msg, doc, pos)
特别注意
JSON 中的键-值对中的键永远是 str
类型的。
当一个对象被转化为 JSON 时,字典中所有的键都会被强制转换为字符串。这所造成的结果是字典被转换为 JSON 然后转换回字典时可能和原来的不相等。换句话说,如果 x 具有非字符串的键,则有 loads(dumps(x)) != x
。
例如:
>>> dic = {1:'a',2:'b',3:'c'}
>>> dic[1]
'a'
>>> json.dumps(dic)
'{"1": "a", "2": "b", "3": "c"}' 《==dump之后将key转换成了str
>>> json.loads('{"1": "a", "2": "b", "3": "c"}')
{'1': 'a', '2': 'b', '3': 'c'} 《==再次load之后key值还是str,与dump之前的int型不一至
>>>
所以在使用json作为交换数据格式时,一定要注意dict类型的key值类型。
扩展
json库中上述四个接口的默认行为已经可以满足大部分应用场景,不过python还保留了用户自定义的方式。
主要是来自于接口中默认参数:像设置自定义编解码器的参数cls
、对解码出的字面值做特殊处理的钩子函数xxx_hook
等。
- 自定义编码器
默认编码器原型
class json.JSONEncoder(*, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, sort_keys=False, indent=None, separators=None, default=None)
继承此类,并实现default
接口实现自定义的动作。
- 自定义解码器
默认解码器原型
class json.JSONDecoder(*, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, strict=True, object_pairs_hook=None)
继承此类,并实现decode
接口实现自定义的动作。还可以实现一些钩子函数传给对应的默认参数
参考
接口中默认参数的说明,参考官方文档