首先,我们要了解MongoDB的基本运行机制。这将有助于我们理解MongoDB的核心。
在此之前,我们需要明白六个简单的概念:
- MongoDB与你所熟悉的数据库有一些相同的概念。在一个MongoDB实例instance中,你可以拥有0个或者多个数据库database,它们每一个都是高性能容器。
- 一个database可以拥有0个或者多个集合collection。你可以认为传统的table和collection是同一个概念。
- 一个集合可以拥有0个或者多个文档document。同样地,你可以将它看作是传统数据库中的row。
- 一个文档document是由field组成的,你可能已经猜出来了,你可以把它看作是一个column。
- MongoDB中的索引index,和关系型数据库中索引的概念十分相似。
- 游标Cursor不同于其他5个概念,但是它们是非常重要的,但通常会被忽视。重点需要理解的是,当向MongoDB请求数据,它将返回一个结果集的指针,我们称之为游标。
概要回顾,MongoDB由database组成,database包含有collection,collection由document组成,每个document由若干个field组成。
Collection可以被索引,这将提高查找和排序的性能。最终,当我们通过游标cursor来获取MongoDB中的数据。当游标返回时候,并没有执行查询操作,真正的查询操作会延时要真正需要的结果的时候,比如调用它的hasNext或者next方法,这是才会访问数据库。
为什么要使用这些新的名词(集合vs 表, 文档vs行, field vs列)?仅仅是为了让事情更加复杂吗?真相就是,这些概念很传统关系型数据库中对等物的概念很相似,但是,它们又不一样。核心的不同在于,关系型数据库在table的层次定义列,而面向文档的数据库中,数据库定义它的field在文档的层次上。这就是说,在集合中每一个文档都有它自己独立的field集。因此,collection是一个相对table简化的容器,而文档拥有比row更多的信息。
虽然理解这些很重要,但是如果对一些概念还不够清晰,不要担心。用不了几个插入操作,你就能真正理解它的含义。最终,你将明白关键就是collection对于将存储什么样的结构的数据要求是不严格的,或者说它是无模式的。Field被独立的文档所跟踪。这其中的优点和缺点我们将在后续的章节中说明。
让我们来动手实践一下(hands-on)。运行mongod server和 mongo shell。Shell可以运行JavaScript。这里有一些可以执行的全局(global)命令,比如 db.help() db.stats()等。这些命令的执行可以是针对某个一个指定的collection,而我们也通常会这么做,比如,通过db.COLLCECTION_NAME对象,执行
db.unicorns.help() or db.unicorns.count() 。
需要注意的一点是,因为这是一个JavaScript shell,如果你要执行一个method,而忽略了圆括号(),你将看到方法体,而是不要执行的方法。所以,如果你输入db.help而不是db.help(),你将看到help方法内部的实现。
首先,我们使用use来选择数据库。即使数据库不存在也没有关系,因为当我们创建collection时候,如果database不存在,它会被自动创建(注:默认使用test数据库,如果需要切换或者新建,可以使用use命令,需要注意的是,对于新建,需要往数据库中插入一条数据,才能看到新建的数据库)。
现在,你正在一个database的世界中,你可以使用(issuing)数据库命令,比如db.getCollectionNames()。如果你这么做了,你将得到一个空的数组([ ])。因为collection事无模式的,我们并不需要显式创建它们,直接插入即可。
我们可以使用insert命令简单地插入一个document到一个新的collection中:
db.unicorns.insert({name: 'ygs'})
上面这一行将在unicorns集合中执行insert命令,并传递进入了一个参数。MongoDB内部使用二进制的序列化JSON格式,即BSON。外部,这就意味着我们更多的是使用JSON作为参数。如果此时执行db.getCollectionNames()我们将看到一个unicorns集合。
你可以使用unicorns的find命令来返回document文档的列表。
db.unicorns.find()
结果输出:
{ "_id" : ObjectId("593580006556fa7ec7a3735b"), "name" : "ygs" }
注意,这里有个_id field。每个document都必须有个唯一的_id field。你可以选择自己创建一个或者让MongoDB为你创建一个ObjectId类型的值。通常,你可以希望MongoDB帮你创建。默认的,_id field是索引,你可以使用getIndexes()命令确认:
db.unicorns.getIndexes()
结果输出:
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test.unicorns"
}
]
现在,回到我们讨论的无模式的collection。插入一个完全不相同的document到unicorns中,比如
db.unicorns.insert({age:26})
通过find命令列出所有document结果为:
{ "_id" : ObjectId("593580006556fa7ec7a3735b"), "name" : "ygs" }
{ "_id" : ObjectId("593585316556fa7ec7a3735c"), "age" : 26 }