最近在读阿里数据中台的书,因为要在组内做分享,就多度了几遍。与阿里大数据实践之路配合,基本可以看到阿里建设数据中台的过程,和一些技术细节。做一件有价值的事情就是把自己觉得好的东西分享出来,那么开始内容
(1)大数据的发展历程和价值探索
大数据的发展
文章开篇是一段作者建设数据中台过程的心路历程,下来就是老套路,介绍了国内外大数据发展的历程与大数据的价值探索,这里做简单的介绍。
两个重要的节点需要说一下:
- 2003年谷歌公开了内部对于海量文件的处理技术、GFS分布式文件系统、并行计算处理框架MapReduce、高效数据存储模型BigTable,这些促成了分布式系统基础架构---hadoop。为各个大数据组件的诞生打下基础。
- 2012年全球大数据从TB上升到PB,也是阿里大数据之路开端的一年。
大数据的价值
大数据的价值书中主要从四个方面介绍,在下面的四个方面都深刻的解析了大数据的实际应用和真是含义。
- 语义层面:‘数据’即所有信息的记录,例如用户访问网站的信息的转化过程的行为属性;大是巨量的意思,可以隐身为数量、形式、含义的丰富,保障实现被高保真的记录与回放
- 实现层面:大数据是一套数据处理技术活方法体系,实现具体以上特征的数据的存储、计算、共享、备份和容灾、保密等,保证数据处理的时效性和拓展性
- 服务层面:大数据的数据技术变革引发的新型信息服务模式,例如从数据探索出发,系统主动推送信息给用户做决策、给及其优化参数、基于数据的量变完成数据的质变
- 应用层面:大数据是数据服务组合生成的新场景、新体验、日益增长的数据量非但不会使信息获取效率降低、质量下降,反而会让每个人都能得到快速的迭代,个性化的互联网服务。
(2)阿里的大数据主张
在数据提供服务的基础上,阿里对数据的要求是准、快、全、统、通,简单的解释是标准统一
融会贯通、资产化、服务化、闭环自优,这是阿里数据中台实现目标的核心。
要实现上面的目标,如何做呢?
图片展示了数据中台运行的过程,主要抽象成三个部分
第一部分:OneData致力于实现数据的标准与统一
第二部分:OneEntity致力于实现实体的统一,让数据融通而非以孤岛存在,为精准的用户画像提供基础
第三部分:OneService致力于实现数据服务统一,让数据复用而非复制
从两一个维度看一下数据中台赋能业务的全景图
- 数据后台:计算数据后台同时具有离线计算、实时计算计算能力和在线分析能力从而可以让用户今早的看见昨天及以前汇总及萃取的数据,准确无误的看到上一秒产生的数据、在线分析,查看海量的数据
- 数据中台:云上数据中台、通过智能数据能力实现全局数据仓库规划、数据规范定义、数据建模研发、数据连接萃取、数据运维监控,拥有多样的数据的分层数据中心。
- 数据前台:数据前台的核心是通过数据的复用,为多个业务线提供数据高效的数据服务。
——————————————————————————————————————
今天就介绍到这里,下次介绍阿里巴巴的大数据建设过程,主要以时间为主线介绍。
附下篇文章地址,感兴趣可以继续查看
https://www.jianshu.com/p/fe573eacb822