数据中台VS数据仓库VS数据平台

▌数据中台和数据仓库、数据平台的关键区别

这是现在数据行业大家经常讨论的问题,到底数据仓库、数据平台和数据中台的区别是什么。

图片发自简书App

概括地说,三者的关键区别有以下几方面:

1、数据中台是企业级的逻辑概念,体现企业 D2V(Data to Value)的能力,为业务提供服务的主要方式是数据 API;

2、数据仓库是一个相对具体的功能概念,是存储和管理一个或多个主题数据的集合,为业务提供服务的方式主要是分析报表;

3、数据平台是在大数据基础上出现的融合了结构化和非结构化数据的数据基础平台,为业务提供服务的方式主要是直接提供数据集

4、数据中台距离业务更近,为业务提供速度更快的服务;

5、数据仓库是为了支持管理决策分析,而数据中台则是将数据服务化之后提供给业务系统,不仅限于分析型场景,也适用于交易型场景;

6、数据中台可以建立在数据仓库和数据平台之上,是加速企业从数据到业务价值的过程的中间层。

数据仓库具有历史性,其中存储的数据大多是结构化数据,这些数据并非企业全量数据,而是根据需求针对性抽取的,因此数据仓库对于业务的价值是各种各样的报表,但这些报表又无法实时产生。数据仓库报表虽然能够提供部分业务价值,但不能直接影响业务。

数据平台的出现是为了解决数据仓库不能处理非结构化数据和报表开发周期长的问题,所以先撇开业务需求、把企业所有的数据都抽取出来放到一起,成为一个大的数据集,其中有结构化数据、非结构化数据等。当业务方有需求的时候,再把他们需要的若干个小数据集单独提取出来,以数据集的形式提供给数据应用。

而数据中台是在数据仓库和数据平台的基础上,将数据生产为为一个个数据 API 服务,以更高效的方式提供给业务。

数据中台解决的问题可以总结为如下三点:

效率问题:为什么应用开发增加一个报表,就要十几天时间?为什么不能实时获得用户推荐清单?当业务人员对数据产生一点疑问的时候,需要花费很长的时间,结果发现是数据源的数据变了,最终影响上线时间。

协作问题:当业务应用开发的时候,虽然和别的项目需求大致差不多,但因为是别的项目组维护的,所以数据还是要自己再开发一遍。

能力问题:数据的处理和维护是一个相对独立的技术,需要相当专业的人来完成,但是很多时候,我们有一大把的应用开发人员,而数据开发人员很少。

这三类问题都会导致应用开发团队变慢。这就是中台的关键——让前台开发团队的开发速度不受后台数据开发的影响。

数据中台设计的初衷是将计算与存储分离,从狭义上来说,真正最核心的数据中台可以是没有存储的。但就当前的情况来看,广义的数据中台在未来一段时间内仍会涵盖数据仓库、数据湖等存储组件,“数据工厂”这个概念可能更适用于现在的阶段。但随着数据中台的发展,未来很有可能不再需要数据湖了。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • //我所经历的大数据平台发展史(二):非互//我所经历的大数据平台发展史(二):非互联网时代 • 下篇http:/...
    葡萄喃喃呓语阅读 12,434评论 2 36
  • 【姓名】 贾孜睿 【派别】文魁派 【导师】王玉印、袁文魁 【分舵】第一分舵 【舵主】刘丽琼 选了三幅已经超级完美的...
    懵球小贾阅读 1,391评论 2 2
  • 前几日老爸一连发了好几个红包给我,我并没有和他说我已经到了财殚利竭的地步…事后,老爸说起缘由! 还不是怕你在外面受...
    忆心y阅读 1,337评论 0 1
  • 我好怕自己变成一个神经病 自己疯疯傻傻 连死都不懂 家里人操心一辈子 你呢 就这么一走了之 倒也是决绝 有时候恨你...
    重复走阅读 1,738评论 0 0
  • 练习026 不看镜子,笑一笑,记录下来。 要完成笑的作业,正思忖,什么事情好笑呢? 不妨先来个一个机械...
    蕙草阅读 1,477评论 0 0

友情链接更多精彩内容