基本数据类型
MongoDB文档类似JSON,在概念上和JS中的对象神似。
- null
表示空值或不存在的字段
{"x":null}
- 布尔
布尔类型有true和false
{"x":true}
32bit整数
JS仅支持64位浮点数,32位整数会被自动转换。因此shell中此类型不可用。64bit整数
shell会使用一个特殊的内嵌文档来显示64位整数,shell不支持这个类型。64bit浮点数
shell中数字均使用此类型
{"x":3}
{"x":3.14}
- 字符串
UTF-8字符串均可表示为字符串类型的数据
{"x":"foobar"}
符号
shell不支持此类型,shell将数据库中的符号类型转换为字符串。对象id
对象id是文档的12byte的唯一ID
{"x": ObjectId()}
- 日期
日期类型存储的是从标准纪元开始的毫秒数,不存储时区。
{"x": new Date()}
- 正则表达式
文档中可包含正则表达式,采用JS的正则表达式语法。
{"x": /foobar/i}
- 代码
文档中可包含JS代码
{"x": function(){...} }
二进制数据
二进制数据可由任意字节的串组成,shell中无法使用。最大值
BSON包括一个特殊类型,表示可能的最大值,shell中无此类型。最小值
BSON包括一个特殊类型,表示可能的最小值,shell中无此类型。未定义
文档中可使用未定义类型,JS中null和undefined是不同类型。
{"x": undefined}
- 数组
值得集合偶列表可表示成数组
{"x": [1,"a",2.12]}
- 内嵌文档
文档可包含别的文档,也可作为值嵌入到父文档中。
{"x": {"foo": "bar"}}
数字
JS只是一种数字类型(64bit浮点数),MongoDB中有3种数字类型(32bit整数、64bit数字、64bit浮点数)。默认情况下,shell中数字都被MongoDB当做双精度数。
这意味着若你从数据库中获得是一个32位整数,修改文档后,将文档存回数据库时,此时整数会被转换为浮点数,即便保持整数原封不动也会这样。所以明智的做法是尽量不要在shell下覆盖整个文档。
数字只能表示为双精度数(64bit浮点数)的另一个问题是,有些64bit的整数并不能精确地表示为64bit浮点数。所以,要存入一个64bit整数,然后在shell中查看,它会显示一个内嵌文档,表示可能不准确。
内嵌文档只表示shell显示的是一个64bit浮点数近似表示的64整数,若内嵌文档只有一个健的话,实际上这个值是准确的。
若要插入的64bit整数不能精确地作为双精度数显示,shell会添加两个键top和bottom,分别表示高32bit和低32bit。
> db.user.insert({"age":92233720368547766000})
> db.user.findOne()
{
"_id" : ObjectId("5a04c7a79486f0b25bd10142"),
"age" : 9.22337203685478e+19
}
日期
JS中Date对象用作MongoDB的日期类型,创建一个新的Date对象时会调用 new Date(),而不是Date()。调用构造函数实际上会返回对日期的字符串表示,而非真正的Date对象。这不是MongoDB的特性,而是JS本身的特性。
shell中的日期显示使用本地时区设置,但日期在数据中是以从标准纪元开始的毫秒数的形式存储的,没有与之相关的时区信息。
数组
数组可作为有序对象(如列表、栈、队列)来操作,也可作为无需对象(如集合)操作。
文档中的数组有个奇妙的特性,MongoDB能理解数组的结构,并知道如何深入数组内部对其内容进行操作。这样就能用内容对数组进行查询和构建索引了。
内嵌文档
内嵌文档把整个MongoDB文档作为另一个文档中键的一个值,这样数据可组织德更自然些,不用非得存在扁平结构的。