mongoDB -BSON

BSON 是一种二进制序列化格式,用于在 MongoDB 中存储文档和进行远程过程调用。 详细参考:https://bsonspec.org/
每个 BSON 类型都有整数和字符串标识符,如下表所示

数据类型

类型 整数标识 别称 备注
Double 1 double
String 2 string
Object 3 object
Array 4 array
Binary data 5 binData
Undefined 6 undefined 丢弃
ObjectId 7 objectId
Boolean 8 bool
Date 9 date
Null 10 null
Regular Expression 11 regex
DBPointer 12 dbPointer 丢弃
JavaScript 13 javascript
Symbol 14 symbol 丢弃
JavaScript code with scope 15 javascriptWithScope 在mongodb 4.4 版本丢弃
32-bit integer 16 int
Timestamp 17 timestamp
64-bit integer 18 long
Decimal128 19 decimal 在mongodb 3.4 版本新增
Min key -1 minKey
Max key 127 maxKey
  • $type 运算符支持使用这些值按 BSON 类型查询字段。 $type 还支持匹配 等类型集合,称为 number
  • $type 聚合运算符返回其参数的 BSON 类型
  • $isNumber 聚合运算符: 如果其参数是 整数(32-bit integer),长整形(64-bit integer)、小数(double)、浮点型(decimal),则返回 true。在mongodb 4.4版本新增

常用类型详解

1. ObjectId
全局唯一,自动有序递增。总共占12个字节,由三部分组成:

  • 4字节的时间戳,表示ObjectId 创建的时间,以unix 秒为单位
  • 每个进程单独生成的5字节的随机值
  • 3字节的递增计数器,初始值为随机值

如果使用整数值来创建 ObjectId,则此时该整数值将替换时间戳
在 MongoDB 中,存储在集合中的每个文档都需要一个唯一的 _id 字段作为主键。如果插入的文档省略了 _id 字段,MongoDB 驱动程序会自动为 _id 字段生成一个 ObjectId。 这也适用于通过带有 upsert: true 的更新操作插入的文档。 MongoDB 客户端应添加具有唯一 ObjectId 的 _id 字段。将 ObjectIds 用于 _id 字段可提供以下额外好处:

  • 在 mongosh 中,您可以使用 ObjectId.getTimestamp() 方法访问 ObjectId 的创建时间。
$  ObjectId("6278c6085f51ccd692ec9a10").getTimestamp()
ISODate("2022-05-09T07:43:04.000Z")
  • 对存储 ObjectId 值的 _id 字段进行排序大致相当于按创建时间排序

注意:虽然 ObjectId 值应随时间增加,但它们不一定是单调的。
这是因为他们: 秒级别的时间分辨率,因此在同一秒内创建的 ObjectId 值没有保证顺序,并且 时间戳可能是具有不同系统时钟的客户端生成的

2. String
BSON 字符串是 UTF-8编码的。通常,在序列化和反序列化 BSON 时,每种编程语言的驱动程序都会从语言的字符串格式转换为 UTF-8。这使得可以轻松地将大多数国际字符存储在 BSON 字符串中。
此外,MongoDB $regex 查询在正则表达式字符串中支持 UTF-8

Timestamp
BSON 提供了特殊的时间戳类型供内部 MongoDB 使用,占64位(8字节), 该时间戳与常规的 Date 类型无关。其中:

  • 最高有效 32 位是 time_t 值(自 Unix 纪元以来的秒数)
  • 最低有效 32 位是给定秒内操作的递增计数

在单个mongod实例中,时间戳值始终是唯一的。BSON 时间戳类型供内部 MongoDB 使用。在大多数情况下,在应用程序开发中,请使用 BSON 日期类型(Date)

Date
BSON Date 是一个 64 位整数,表示自 Unix 纪元(1970 年 1 月 1 日)以来的毫秒数。这导致过去和未来大约 2.9 亿年的可表示日期范围

// 获取时间 方法一
var mydate1 = new Date()
// 方法二
var mydate2 = ISODate()
// 将日期转化为字符串类型
mydate1.toString()
// 获取对应时间的月份, 注意 月份是从0开始的, 1到12月 由  0~11 代表
mydate1.getMonth()

比较和排序

比较不同BSON类型的值时,MongoDB使用以下从小到大的顺序比较:

1 MinKey (内部类型)
2 Null
3 Numbers (ints, longs, doubles, decimals)
4 Symbol, String
5 Object
6 Array
7 BinData
8 ObjectId
9 Boolean
10 Date
11 Timestamp
12 Regular Expression
13 MaxKey (内部类型)

1. 数值类型

对于ints, longs, doubles, decimals 这些数值类型,MongoDB 将这些类型视为等效类型,比较之前进行转换

2. 字符串

默认情况下,MongoDB将字符串转换成二进制来进行比较
Collation(mongodb 3.3 版本新增)允许用户为字符串比较指定特定的语言规则,例如字母大写和重音符号的规则, 关于collation 详见https://www.jianshu.com/p/4bcd86cd9103

3. Arrays

对于数组,小于比较或升序排序比较的是数组中的最小元素,大于比较或降序排序比较的是数组中的最大元素。

当字段是单元素数组与非数组字段进行比较时,比较的是数组的元素和非数组字段的值。空数组参与比较的话,会将空数组视为小于null或缺少此字段。

4. Objects

MongoDB对BSON对象的比较使用以下顺序:

1.按照键值对在BSON对象中出现的顺序递归比较它们。

  1. 比较字段类型, 按照如下的从小到大的顺序

MinKey (internal type)
Null
Numbers (ints, longs, doubles, decimals)
Symbol, String
Object
Array
BinData
ObjectId
Boolean
Date
Timestamp
Regular Expression
MaxKey (internal type)

3.比较关键字段名称。
4.如果关键字段名称相等,则比较字段值。
5.如果字段值相等,则比较下一个键/值对(返回步骤1)。没有下一个字段的对象小于有下一个字段的对象。

5. 日期和时间戳

在3.0.0版本中进行了更改,将日期对象放在时间戳对象之前排序。

在早期的版本中是将两种对象放在一起进行比较的。

6. 不存在的字段

MongoDB将不存在的字段视为是空的BSON对象。

例如:{}和{a : null}进行比较,那么在比较的时候,a字段和空文档将视为等价的。

7. BinData

MongoDB按BinData以下顺序排序:

首先,比较数据的长度或大小。
然后,按BSON的一字节子类型进行比较(one-byte subtype)。
最后,根据数据执行逐字节比较。

参考:https://www.mongodb.com/docs/manual/reference/bson-types/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,914评论 2 89
  • 1 MongoDB中的基本概念及原理 1.1 MongoDB介绍 官网地址:https://www.mongodb...
    MiniSoulBigBang阅读 525评论 0 0
  • MongoDB MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源非关系数据库系统(NoSQL)...
    苟且_7c59阅读 249评论 0 0
  • 基本介绍 什么是NoSQL数据库 NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL...
    我就是小政政阅读 2,118评论 0 11
  • 本文主要记录近期学习 MongoDB 的一些内容,主要参考了官方文档 https://docs.mongodb.c...
    SheHuan阅读 793评论 0 1