数据仓库、数据集市、数据湖、数据中台有什么区别?都得做么?

随着云计算、大数据、移动互联网、物联网、人工智能等新技术的不断发展,数据呈现出爆炸式增长,并迅速成为全球各个国家和地区发展的核心生产资料。现如今,数据正在驱动百行百业变革新生,企业数字化转型也迫在眉睫。

伴随着企业数字化转型的浪潮,数据仓库、数据集市、数据湖、数据中台等术语“迎风而生”,那么这些术语到底有什么区别呢?企业数字化转型是不是都得做这些工作呢?为了让广大用户更好的理解这些术语,“i 说数据”今天用大白话来解答这些问题。

一、什么是数据仓库?

首先,我们要知道什么是仓库?仓库有什么用?主要用户有哪些?

仓库是一种贮存物品的设施。仓库中不同的分类,每个分类都有一个唯一编码,它是为了方便仓库管理员对物资进行管理,通过这个编码,仓库管理员可以清楚的知道物品在哪个货架,在哪个位置。

数据仓库就相当于一个贮存数据的仓库,在这里,数据按照特定的模型组织起来,这种模型对数据管理员来说相对友好,因为它按照一种更加集约化的规则将数据管理起来了,存放集中、规整,提取数据不用跨库寻找,查找的效率更加高。

二、什么是数据集市?

举个例子。前文我们说了,数据仓库是对数据管理员相对友好。但是,那种模型对业务人员来说不友好。比如顾客不能直接去超市逛仓库吧。顾客的需求,是按照物品的种类分门别类,按照生活习惯的不同,组合在一起展示的。比如超市中会按照蔬菜、水果、肉类、生活用品等分类,将不同的物品组合在一起进行摆放,有的超市会在扶梯口放一些日常用品等。

虽然,像沃尔玛、华润万家等大型超市也被吐槽,但总的来说,比让顾客直接逛仓库好得多。

所以,数据集市就像超市摆放物品,正如其名字“集市”一样,是一个面向最终用户(顾客)的数据市场,在这里,数据(物品)以一种更加容易被业务人员(顾客)接受的方式组合在一起,这些组合方式可能是多变, 因为业务人员(顾客)的需求是多变的,因此我们需要定期调整集市的计算口径(物品的组合方式),经常会创建新的数据集市(新的物品组合)。

三、什么是数据湖?

举个例子,我们要做一顿丰盛的午餐,首先需要去超市购买各种原材料(米、面、油、肉、蔬菜、水果等),其次需要厨师做饭,最后,需要对没有用完的物品进行保鲜存储,不能浪费么。

所以,数据湖是存储了企业所有原始数据的存储,同时原始数据对数据管理能力依赖性很强,(不同原材料组合,厨师会做出不同口味的饭菜),此外,加工后数据的存储也很复杂(做好的饭菜如果没有保存好,会坏掉)。

四、什么是数据中台?

数据中台是近年来刚兴起的名词,目前业界还没有一个特别明确的定义,“i 说数据”套用饭店与菜单的例子给出一个解释。

一个饭店要开店营业,首先需要有原材料供应与存储,其次需要有厨师对原材料进行处理(厨师做饭),最后需要把成果展示给顾客(饭菜),同时也需要有各种服务辅助(菜单、点餐系统、付款系统、音乐等),提升顾客的就餐体验。

我们可以将其分为狭义的数据中台和广义的数据中台。狭义的数据中台(原材料+厨师+饭菜),指的是一套数据应用和工具,包括分布式ETL、数据资产管理、数据标签管理、数据沙箱、自助分析平台、元数据管理、数据质量管理、数据全生命周期管理等等,底层则以现有的数仓、大数据平台等为数据源,为企业提供数据资产管理的能力,并持续挖掘数据价值,持续提供数据智能服务。

广义的数据中台(原材料+厨师+饭菜+就餐服务),则在狭义的数据中台基础之上,包含了顶层数据战略,数据治理体系以及数据管理及运营、数据文化培养和组织架构支撑,是一套可持续管理和运营的体系。

总得来说,数据中台是为了提高数据服务能力,更贴近用户。以用户为中心也是数字化转型的核心理念,同时也是DT时代的趋势。

五、都得做么?

这个问题要看具体的企业情况,总的来说,一个大原则是以满足业务发展为第一优先,不要为了做基础设施而做基础设施,一定要以能解决业务诉求为最终目的。

企业数字化转型是为了提高用户响应力,帮助企业在商战上先发制人,始终抢得先机。

简言之,用了一系列先进的新技术不见得就是数字化领军企业,不用也不见得就是古典互联网时代的落后作坊。关键是认清自身的数字化现状,拟定数字化目标,制定数字化路径,优选场景,实现价值。新技术、各类数据基础设施只是这条道路上,一套套切实可行的行动方案,是把过去各行各业的种种数字化的尝试,重新以体系化、结构化的方法论梳理,并且赋予当下最新的技术架构予以实施。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351