三分钟入门大数据之什么是NoSQL?

哈喽,大家好,我是汉斯老师。近几年来,互联网行业由于较高的薪资收入,受到许多人的追捧。很多年轻的学子,或是其他行业的有志青年,都想要投身到这个行业中来。然而一方面受到“互联网寒冬”的影响,最近频频传出各家知名互联网公司裁员缩编的消息;另一方面,大量的人才涌入,又使得互联网产业在职场上呈现出供过于求的特征,并最终导致了职场上的激烈竞争。那么互联网行业未来的潜力在哪里?我们又应该在哪个方向上发力,才能保证自己可以获得一份高薪而稳定的工作?基于多年的互联网行业从业经验,汉斯老师在这里向大家推荐大数据方向,希望通过本人的《三分钟入门大数据》和《十分钟精通大数据》等系列文章,帮助所有有志了解学习大数据的朋友掌握大数据的相关知识,也欢迎所有对互联网行业以及大数据领域感兴趣的朋友前来交流。




学习大数据相关知识的小伙伴们,应该经常会接触到一些NoSQL数据库。然而,很多新人往往对于NoSQL的概念以及其为什么会在大数据中被广泛提及和使用产生困惑,下面汉斯老师来给大家加深一下对NoSQL的理解。

什么是NoSQL(非关系型数据库)?

NoSQL直观的定义是非关系型数据库。

非关系型数据库的特点或优势是什么?

这里我们要从关系型数据库开始说起。关系型数据库就是我们日常开发或生产时常用的数据库,比如Oracle数据库,MySQL数据库等等。关系型数据库的特点在于其存储的结构化。大家回想一下,当我们想要存储数据到某个关系型数据库时,我们往往需要首先在数据库中创建一个表,然后定义表结构。所有需要存储的信息,需要以表字段的形式逐一定义出名称,类型以及长度等属性。当我们定义好这张表后,我们才能把数据按照定义好的格式存储进数据库中。那么这个时候,就会出现问题了。直观的比如下两个问题:

A. 如果某一条数据缺失其中部分表字段的值,但我们又需要存储它,那么我们只能按预设的结构把这条数据存储进去,即使其很多表字段的值为空。

B. 若因为某种原因需要增加一个表字段,则所有的数据,包括已经完成存储的一些数据也需要被增加表字段,即使对于这些数据来说,这个表字段完全没有意义。

当然,除了比较直观的问题外,还有一些较为隐晦但却很重要的问题,比如说:

C. 传统关系型数据库在读取数据时,是将一条数据的全部信息整行都读取到内存中,即使我们有时候只是需要其中一两个字段。

如上的一些问题,在数据存储量较小时,其实并不会造成太多的困扰。然而当我们进入到大数据的背景下来讨论这些问题时,这些问题就比较棘手了。试想一下,如果我今天要存储海量的会员数据,然而有的会员数据信息多,有的会员数据信息比较少,这个时候我要怎么定义表结构?如果按照最大化原则来做,是不是会造成大量的无效存储?如果有一天又要增加新的表字段,是不是所有的数据都要被改动?如此庞杂的表结构,在对海量数据进行统计分析时,如果都加载出来,是不是会极大地降低查询语句的执行效率?这些问题,事实上就是窜通关系型数据库在面对海量数据时的缺陷,而为了弥补这些缺陷,非关系型数据库就被提出来了。

非关系型数据库为什么能解决这些问题?

非关系型数据库能解决这些问题的关键,就在于其存储方式是非结构化的(或半结构化的)并且很多非关系型数据库是列式存储。

非结构化存储意味着在NoSQL数据库中,你不需要预先定义好表结构,每一条数据的表结构都可以是不一样的。这就解决了上面A和B的问题。而列式存储,则让数据库具备了快速查询或计算海量数据中某一个或几个字段的能力,这又解决了C问题。

事实上,非关系型数据库绝不只是为了解决上面这些问题而被广泛应用的,非关系型数据库与关系型数据库的区别也并非如此肤浅。然而对于初学者来说,首先要正确认识非关系型数据库最直观的特点。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容

  • 本文转自:http://blog.csdn.net/sunxianghuang/article/details/5...
    Andy_0801阅读 1,349评论 0 8
  • 数据库的基本是概念名词解释: 数据库名词解释 元组:可以理解为表的每一行就是一个元组 候选码:若关系中的某一属性组...
    杰伦哎呦哎呦阅读 1,111评论 0 6
  • 为何要使用NoSQL数据库? 1.NoSQL具有灵活的数据模型,可以处理非结构化/半结构化的大数据 2.NoSQL...
    毛子阿卡西阅读 534评论 0 3
  • 概览一下大数据项目中可以使用的数据存储技术,聚焦于Couchbase 和 ElasticSearch,展示如何使用...
    abel_cao阅读 1,753评论 1 29
  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,311评论 0 9