数据库 VS 数据仓库

数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师?


从本质上来说,数据库和数据仓库都是数据的集合。没什么不同。

但是它们的定位确是不一样。数据库是服务于事务处理的(OLTP),数据仓库是服务于商业数据分析的(OLAP)。

用户在前端进行的操作,产生了事务和数据的变化,数据库要对这部分的数据进行增加、删除和修改。所以数据库的操作是相对简单的读写,只作用于相对少量的数据。由于数据库操作的主要对象的表中的事件记录,对其进行增删改,对应的行式存储就是最适合数据库的存储方式。

基于以上特征,数据库一般采用的软件为MySQL,Oracle,SQLServer等关系型数据库进行数据存储。基于3NF原则,搭建E-R表格,结构较为复杂,存储紧致少冗余,对读和写都有优化的数据结构。

而使用数据仓库的人主要是管理和运营人员,通过对历史数据的分析和洞察来做出相应的商业决策。所以数据仓库要求数据很全,需要把所有的数据整合到一起,从某些维度进行深入的分析。由于数据仓库主要是基于某些维度对大量的数据进行查询,那么列式存储最能提高查询效率。

基于以上特征,数据仓库一般采用Hive,Greenplum,AWS Redshift等分布式数据库。在搭建数据仓库时则根据星型模型或雪花模型创建事实表和维度表。基于事实表和维度表查出面向各个业务主题的数据,然后可视化地展现出来。因此数据仓库的表结构相对简单,存储松散多冗余,一般只对读取做优化。


数据库和数据仓库对比
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 上一篇:098-BigData-26Hive企业级调优 十、数据仓库 10.1 什么是数据仓库数据仓库,英文名称为...
    AncientMing阅读 885评论 0 2
  • 数据仓库数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的Int...
    Albert陈凯阅读 5,081评论 0 15
  • 前言 互联网行业,除了数据量大之外,业务时效性要求也很高,甚至很多是要求实时的, 另外,互联网行业的业务变化非常快...
    原上野阅读 9,373评论 5 32
  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,494评论 0 9
  • 一个人疲惫不堪地躺在地上,紧闭双眼,脸色绿黄,他的生命已经奄奄一息。 他从生命的最初世界赶来,穿越漫长时空,翻过千...
    秦倪阅读 520评论 0 2