python学习笔记之--JSON库

简介

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,是ECMAScript的一个子集。常用于web应用中作为对象的序列化,也经常作为配置文件存在(替换INI配置文件),json格式更易于人理解。

在python语言中有专门的标准库--JSON对这种格式数据进行操作

JSON库

JSON库提供的接口很简单,类似python的序列化库marshalpickle。常用的API只有两种:序列化接口和反序列化接口

序列化接口

序列化就是将python的对象转换成json格式

  • 对象类型转换表
python json
dict object
list、tuple array
str string
int、float、枚举 number
True/False true/false
None null
  • dump接口
    json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

此接口可以将obj进行序列化,并存放在fp中,而fp是支持write的file类型,可以是文件或者流(像socket、stdout等)
例如:

import json

data = [1, 'a', {'b': (1.0, 'c')}]

with open("test.json", "w") as f:
    json.dump(data, f)
  • dumps接口
    json.dumps(obj, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

obj 序列化为 JSON 格式的 str。 其参数的含义与 dump()中的相同。

import json

data = [1, 'a', {'b': (1.0, 'c')}]
data1 = json.dumps(data)
print(data1)

反序列化

反序列化就是将json格式文件或者字符串转换成python对象

  • 类型对象转换表
json python
object dict
array list
string str
number(int) int
number(float) float
true/false True/False
null None
  • load接口
    json.load(fp, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

dump接口的动作相反。此接口将fp中存放的json格式数据转换为python对象

例如:

import json

data = [1, 'a', {'b': (1.0, 'c')}]

with open("test.json", "w") as f:
    json.dump(data, f)

with open("test.json", "r") as fp:
    data2 = json.load(fp)
    print(data2)

如果json文件中有中文字符,load时会报错误UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position XXX: illegal multibyte sequence,只需要在open时增加encoding参数即可,如下
with open("test.json", "r", encoding="utf-8") as fp:

  • loads接口
    json.loads(s, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

dumps接口动作相反,此接口将一个json格式字符串反序列化为python对象

异常

与json相关的异常一般出现在反序列化时,当json格式不合法时出现
exception json.JSONDecodeError(msg, doc, pos)

特别注意

JSON 中的键-值对中的键永远是 str类型的。
当一个对象被转化为 JSON 时,字典中所有的键都会被强制转换为字符串。这所造成的结果是字典被转换为 JSON 然后转换回字典时可能和原来的不相等。换句话说,如果 x 具有非字符串的键,则有 loads(dumps(x)) != x
例如:

>>> dic = {1:'a',2:'b',3:'c'}
>>> dic[1]
'a'
>>> json.dumps(dic)
'{"1": "a", "2": "b", "3": "c"}'       《==dump之后将key转换成了str
>>> json.loads('{"1": "a", "2": "b", "3": "c"}')
{'1': 'a', '2': 'b', '3': 'c'}         《==再次load之后key值还是str,与dump之前的int型不一至
>>>

所以在使用json作为交换数据格式时,一定要注意dict类型的key值类型。

扩展

json库中上述四个接口的默认行为已经可以满足大部分应用场景,不过python还保留了用户自定义的方式。
主要是来自于接口中默认参数:像设置自定义编解码器的参数cls、对解码出的字面值做特殊处理的钩子函数xxx_hook等。

  • 自定义编码器
    默认编码器原型
class json.JSONEncoder(*, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, sort_keys=False, indent=None, separators=None, default=None)

继承此类,并实现default接口实现自定义的动作。

  • 自定义解码器
    默认解码器原型
class json.JSONDecoder(*, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, strict=True, object_pairs_hook=None)

继承此类,并实现decode接口实现自定义的动作。还可以实现一些钩子函数传给对应的默认参数

参考

接口中默认参数的说明,参考官方文档

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容