Mongodb索引详解

为什么要使用索引?

当我们在使用mongodb查询操作的时候,每次都需要遍历整个collection去查找匹配条件的数据,对于少量数据来说可能没有性能方面的影响, 但是如果查询的collection中有百万甚至千万的数据,那遍历整个collection对性能影响就很大了,可能一次查询需要花十多秒。所以, 我们就需要使用索引来优化查询。

MongoDB索引类型

MongoDB支持多种类型的索引,包括单字段索引、复合索引、多key索引、地理位置索引、文本索引等,每种类型的索引有不同的使用场合。下面我们依次介绍
我们首先进入到mongo shell创建一个测试数据库testIndex

> use testIndex

创建一个User表并插入几条测试数据

> db.User.insertMany([
...   { name: "张三", email: "zhangsan@qq.com", phone: "13222312222", age: 21, address: ["张三公司地址", "张三家庭地址"] },
...   { name: "李四", email: "lisi@qq.com", phone: "13322218909", age: 20, address: ["李四公司地址", "李四家庭地址"]  },
...   { name: "赵五", email: "zhaowu@qq.com", phone: "13733216673", age: 25, address: ["赵五公司地址", "赵五家庭地址"]  }
... ])
{
    "acknowledged" : true,
    "insertedIds" : [
        ObjectId("5d80f58acb1cb147170b97a6"),
        ObjectId("5d80f58acb1cb147170b97a7"),
        ObjectId("5d80f58acb1cb147170b97a8")
    ]
}

在没有创建index的情况下我们使用explain来分析一下普通查询操作

> db.User.explain().find({name: "张三"})
{
    "queryPlanner" : {
        "plannerVersion" : 1,
        "namespace" : "test.User",
        "indexFilterSet" : false,
        "parsedQuery" : {
            "name" : {
                "$eq" : "张三"
            }
        },
        "winningPlan" : {
            "stage" : "COLLSCAN",
            "filter" : {
                "name" : {
                    "$eq" : "张三"
                }
            },
            "direction" : "forward"
        },
        "rejectedPlans" : [ ]
    },
    "serverInfo" : {
        "host" : "watsons-MacBook-Pro.local",
        "port" : 27017,
        "version" : "4.0.3",
        "gitVersion" : "7ea530946fa7880364d88c8d8b6026bbc9ffa48c"
    },
    "ok" : 1
}

可以看到winningPlan.stage = "COLLSCAN", 意思是collection scan, 即全表扫描,这样的查询需要扫描整个集合进行筛选,性能消耗很大.

单字段索引

为name字段创建索引

> db.User.createIndex({name: 1})
{
    "createdCollectionAutomatically" : false,
    "numIndexesBefore" : 1,
    "numIndexesAfter" : 2,
    "ok" : 1
}

可以看到返回的结果中numIndexesAfter:2,明明我们只为name一个字段创建了索引, 为什么会出现2个索引呢?原因是MongoDB默认为每条数据的_id字段加了索引,我们可以使用以下命定来查看所有索引

> db.User.getIndexes()
[
    {
        "v" : 2,
        "key" : {
            "_id" : 1
        },
        "name" : "_id_",
        "ns" : "test.User"
    },
    {
        "v" : 2,
        "key" : {
            "name" : 1
        },
        "name" : "name_1",
        "ns" : "test.User"
    }
]

可以看到第一个索引的key是_id。
接下来我们使用name来作为查询条件进行查找并使用explain方法来分析此次查找

> db.User.explain().find({name: "张三"})
{
    "queryPlanner" : {
        "plannerVersion" : 1,
        "namespace" : "test.User",
        "indexFilterSet" : false,
        "parsedQuery" : {
            "name" : {
                "$eq" : "张三"
            }
        },
        "winningPlan" : {
            "stage" : "FETCH",
            "inputStage" : {
                "stage" : "IXSCAN",
                "keyPattern" : {
                    "name" : 1
                },
                "indexName" : "name_1",
                "isMultiKey" : false,
                "multiKeyPaths" : {
                    "name" : [ ]
                },
                "isUnique" : false,
                "isSparse" : false,
                "isPartial" : false,
                "indexVersion" : 2,
                "direction" : "forward",
                "indexBounds" : {
                    "name" : [
                        "[\"张三\", \"张三\"]"
                    ]
                }
            }
        },
        "rejectedPlans" : [ ]
    },
    "serverInfo" : {
        "host" : "watsons-MacBook-Pro.local",
        "port" : 27017,
        "version" : "4.0.3",
        "gitVersion" : "7ea530946fa7880364d88c8d8b6026bbc9ffa48c"
    },
    "ok" : 1
}

注意看winningPlan. inputStage.stage = "IXSCAN", "IXSCAN"的意思是index scan, 即根据index扫描。到这里我们可以很确定此次查询使用到了索引.

复合索引

下面来看看复合索引的创建,

db.User.createIndex({name: 1, age: -1})

我们为name和age字段同时创建一个索引,name为升序, age为降序
下面我们来测试这个复合索引

> db.User.explain().find({name: "张三", age: 21})
{
    "queryPlanner" : {
        "plannerVersion" : 1,
        "namespace" : "test.User",
        "indexFilterSet" : false,
        "parsedQuery" : {
            "$and" : [
                {
                    "age" : {
                        "$eq" : 21
                    }
                },
                {
                    "name" : {
                        "$eq" : "张三"
                    }
                }
            ]
        },
        "winningPlan" : {
            "stage" : "FETCH",
            "inputStage" : {
                "stage" : "IXSCAN",
                "keyPattern" : {
                    "name" : 1,
                    "age" : -1
                },
                "indexName" : "name_1_age_-1",
                "isMultiKey" : false,
                "multiKeyPaths" : {
                    "name" : [ ],
                    "age" : [ ]
                },
                "isUnique" : false,
                "isSparse" : false,
                "isPartial" : false,
                "indexVersion" : 2,
                "direction" : "forward",
                "indexBounds" : {
                    "name" : [
                        "[\"张三\", \"张三\"]"
                    ],
                    "age" : [
                        "[21.0, 21.0]"
                    ]
                }
            }
        },
        "rejectedPlans" : [
            {
                "stage" : "FETCH",
                "filter" : {
                    "age" : {
                        "$eq" : 21
                    }
                },
                "inputStage" : {
                    "stage" : "IXSCAN",
                    "keyPattern" : {
                        "name" : 1
                    },
                    "indexName" : "name_1",
                    "isMultiKey" : false,
                    "multiKeyPaths" : {
                        "name" : [ ]
                    },
                    "isUnique" : false,
                    "isSparse" : false,
                    "isPartial" : false,
                    "indexVersion" : 2,
                    "direction" : "forward",
                    "indexBounds" : {
                        "name" : [
                            "[\"张三\", \"张三\"]"
                        ]
                    }
                }
            }
        ]
    },
    "serverInfo" : {
        "host" : "watsons-MacBook-Pro.local",
        "port" : 27017,
        "version" : "4.0.3",
        "gitVersion" : "7ea530946fa7880364d88c8d8b6026bbc9ffa48c"
    },
    "ok" : 1
}

可以看到winningPlan. inputStage.stage = "IXSCAN",复合索引使用成功
** 这里需要注意的是复合索引需要满足prefix原则 **
例如我们创建了一个复合索引

> db.User.createIndex({name: 1, phone: 1, age: -1})

这个索引包含了一下prefix
{name: 1}
{name: 1, phone: 1}
{name: 1, phone: 1, age: -1}
查询条件匹配以上这个三种情况的都可以有效的使用到这个复合索引

多key索引

多key索引是指为数组字段创建索引
例如我们可以为User.address字段创建一个多key索引

> db.User.createIndex({address: 1})

那么在保存address的时候address中的元素会按照升序进行排列

文本索引

例如可以为name字段创建文本索引

> db.User.createIndex({name: "text"})

文本索引固定value为"text",文本索引有利于在大量文本内快速定位到某个字符, 我们可以用来做文章搜索功能

地理位置索引

MongoDB地理位置索引有两种

  1. 2d
  2. 2dsphere

2d位置索引一般用于查找平面内的位置

> db.User.createIndex(<filed>: "2d")

2dsphere位置索引一般用来查询球面位置

> db.User.createIndex(<filed>: "2dsphere")

详情参考官网教程https://docs.mongodb.com/manual/core/2dsphere/

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • 索引能够提高数据库的查询效率,没有索引的话,查询会进行全表扫描(scan every document in...
    zhglance阅读 2,017评论 0 6
  • 一、MongoDB简介 1.概述 ​ MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WE...
    郑元吉阅读 974评论 0 2
  • 1. 介绍、安装、使用(简单写写,不做详细介绍) 1.1 介绍 Mongodb是属于NoSql的一种数据类型; M...
    Grace_ji阅读 1,532评论 0 0
  • 一、MySQL优化 MySQL优化从哪些方面入手: (1)存储层(数据) 构建良好的数据结构。可以大大的提升我们S...
    宠辱不惊丶岁月静好阅读 2,410评论 1 8
  • 这几天我要找个墙面壁思过去,觉得心态不好,着急,焦躁,所以状态也不好,工作也不好。身体也各种不舒服,别人都...
    Fine婧婧阅读 294评论 0 0