文档结构的存储方式,能够更便捷地获取数据
内置GridFS,支持大容量存储
GridFS是一个出色的分布式文件系统,可以支持海量的数据存储。内置了GridFS 的MongoDB,能够满足大数据集的快速范围查询。
海量数据下,性能优越
在使用场合下,千万级别的文档对象,近 10G 的数据,对有索引的 ID 的查询不比MySQL慢,而对非索引字段的查询,则是全面胜出。MySQL实际无法胜任大数据下任意字段的查询,而MongoDB的查询性能令人惊讶。写入性能同样很令人满意,同样写入百万级别的数据,MongoDB比我以前使用过的CouchDB要快得多,基本 10 分钟以下可以解决。观察过程中,MongoDB远算不上 CPU 杀手。
动态查询
全索引支持,扩展到内部对象和内嵌数组
索引通常能够极大地提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录
这种扫描全集合的查询效率是非常低的。特别是在处理大量的数据时,查询可以花费几十秒甚至几分钟,这对网站的性能是致命的。
索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中的一列或多列的值进行排序的一种结构。
查询记录分析
快速,就地更新
高效存储二进制大对象(比如照片和视频)
复制(复制集)和支持自动故障恢复
内置Auto-Sharding自动分片支持云级扩展性,分片简单
提供基于Range的Auto-Sharding机制:
一个collection可按照记录的范围,分为若干个段,切分到不同的Shard上。
Shards可以和复制结合,配合Replica sets能够实现Sharing+fail-over,不同的Shard之间可以负载均衡。
查询时对客户端是透明的。客户端执行查询,统计,MapReduce等操作,这些会被MongoDB自动路由到后端的数据节点。
这让我们关注于自己的业务,适当的时候可以无痛的升级。MongoDB的Sharding设计能力最大支持约20 PetaBytes,足以支撑一般应用。(1PB=1024TB=2^50 字节)
这可以保证MongoDB运行在便宜的PC服务器集群上。PC集群扩充起来非常方便且成本很低,避免了Sharding操作的复杂性和成本。
MapReduce支持复杂聚合
MongoDB中聚合(aggregate)主要用于处理数据(统计平均值、求和等),并返回计算后的数据结果。有点类似于SQL语句中的count(*)。
商业支持,培训和咨询