数据架构
数据架构的思考
- 从数据角度来看,没有组织可以从头开始。即使一个做到了,数据依赖性很快就出现了
- 架构启用组织及其数据的总体视图。架构制品是组织将数据呈现给自己的方式
- 它还启用组织及其数据的长期视图,组织需要架构性的路线图来了解它们的位置,以及它们想要成为的位置以及如何到达那里
- 架构观点对于组织如何运作至关重要,建立其数据策略。架构可以驱动创新
- 当数据在整个组织中流通并被使用时,它就已不复存在,那么我们将明白为什么理想情况下,数据架构实践应该具有全面性,战略性和动态性
业务驱动因素
- 利用新兴技术所带来的业务优势,从战略上帮助组织快速改变产品、服务和数据;
- 将业务需求转化为数据和应用需求,以确保能够为业务流程处理提供有效数据;
- 管理复杂数据和信息,并传递至整个企业;
- 确保业务和IT技术保持一致;
- 为企业改革、转型和提高适应性提供支撑。
数据架构成果和实施
数据架构师需定义和维护的具体事宜:
- 定义组织中数据的当前状态
- 提供数据和组件的标准业务词汇
- 确保数据架构和企业战略及业务架构保持一致
- 描述组织数据战略需求
- 高阶数据整合概要设计
- 整合企业数据架构蓝图
总体数据架构实施包括:
- 使用数据架构(主蓝图)来定义数据需求、指导数据整合、管控数据资产,确保数据项目投入与企业战略保持一致;
- 与参与改进业务或IT系统开发的利益相关方合作,学习并影响他们;
- 通过数据架构及通用的数据词汇,搭建企业数据语言。
基本概念
企业架构框架
企业数据架构
- 企业数据模型:是一个整体的、企业级的、独立实施的概念和逻辑数据模型,为企业提供通用的、一致的数据视图;包括数据实体、数据实体间关系、关键业务规则和一些关键属性
- 数据流设计:定义数据库、应用、平台和网络(组件)之间的需求和主蓝图,数据流展示了数据在业务流程、不同存储位置、业务角色和技术组件间的流动
活动
建立企业数据架构
企业数据架构工作
- 战略:选择框架,制定方法,开发路线图
- 沟通与文化:建立沟通机制,并激励积极参与者
- 组织:通过明确责任和职责来组织数据框架工作
- 工作方法:与企业架构保持一致,在开发项目中定义最佳实践并执行数据架构工作
- 结果:在总体路线图中产出数据架构产品
企业数据架构影响项目和系统开发的范围边界
- 定义项目数据需求:通过数据架构为企业提供每个项目的数据需求
- 评审项目数据设计:通过设计评审来确保概念、逻辑和物理数据模型与架构一致,与组织长期策略一致
- 确定数据溯源影响:确保数据流在应用中的业务规则一致并可追溯
- 数据复制控制:数据架构治理能保证充分的复制控制来达到所需的一致性
- 实施数据架构标准:为企业数据架构生命周期制定和实施标准,标准可表示为原则、流程、指南和规划蓝图
- 指导数据技术和更新决策:数据架构和企业架构一起管理每个应用的数据技术版本、补丁和数据技术路线图策略。
企业数据架构项目相关的活动
- 定义范围:保证范围和接口与企业数据模型一致,理解项目对整体企业数据架构的潜在贡献、项目的建模和设计、哪些现有组件应该或能够被重用。
- 理解业务需求:获取数据相关需求,如实体、资源、可用性、质量和痛点,以及评估满足这些需求的业务价值
- 设计:形成详细的目标规范,包括:数据生命周期内的业务规则、验证结果的有效性、需要提供的时间、提升模型的扩展性和改进标准模型等。
- 实施:什么时候购买软件、什么时候重用数据、什么时候构建
将企业数据架构活动嵌入到项目过程中的三种方式
- 瀑布模式:作为整个企业设计的一部分,在连续阶段中理解需求和构建系统。
- 迭代方式:逐步学习和构建,这种方式适合总体需求模糊的原型,在启动阶段至关重要,最好四早起迭代中创建一个全面的数据设计。
- 敏捷方式:这种方式是指在离散的交付包中学习,构建并测试,敏捷模型能提高目标导向的模型,强调用户界面设计、软件设计和系统行为。
整合其他企业架构
数据架构可能会影响项目的范围,把企业数据架构问题和项目组合管理进行整合,能促进路线图的实施,有助于获得更好的项目效果。
工具
数据建模工具
资产管理软件
图形设计应用
方法
生命周期预测
架构设计可以针对当前,也可面向未来,还可是已实施并完成的,甚至为准备退役的产品,无论哪种情况,其工作成果都应该存档管理
- 当前的:当前支持和使用的产品
- 部署周期的:未来1~2年内部部署使用的产品
- 策略周期的:未来两年后期待使用的产品
- 退役的:一年内,组织已经停止使用或打算停止使用的产品
- 优先的:被多数应用优先使用的产品
- 限制的:在一定应用中限制使用的产品
- 新兴的:为将来可能的部署研究和试行的产品
- 审核的:已评估的产品,评估结果目前不能用于以上状态的产品
图标使用规范
运用模型和图标呈现信息是指以已定义好的且达成共识的一套图标来表达待说明内容的一种方式,具体使用规范如下:
- 清晰一致的说明:应清洗标识并说明所有对象和线条及图标所代表的内容
- 所有图标对象与说明相匹配
- 清洗一致的线条方向:所有线条的流向都应该从某一侧或角开始,尽可能流向对侧或对角。
- 一致的交叉线显示方法:要清楚交叉点并非连接点,在无法避免交叉的情况下允许线交叉;对同一个方向上的所有先使用跨线;不用将线与线直接连接;尽可能减少线交叉现象出现的次数。
- 一致的对象属性:对任何大小、颜色、线条粗细等不同的图标均要求表示不同的内容
- 线性对称:行和列排放整齐的图标比随机摆放的图标易读性更好,更容易理解。
实施指南
就绪评估和风险评估
组织和文化
数据架构治理
数据架构治理活动
度量指标 🌙
架构标准接受率
可以测量项目与已建立的数据架构的紧密程度及项目与企业架构参与流程的遵循度。追踪项目预期的衡量指标也有助于理解和采纳执行过程中出现的
问题
实施趋势:对跟踪企业架构改善组织实施项目能力的程度,至少沿两个方向进行改善
使用/重用/代替/废弃测量,决定使用新架构构建与重用、代替或废弃构件的比例
项目执行效率测量,测量项目的交付时间和可重用构件及指导构件的交付改进成本
业务价值度量指标:追踪向期待的业务效果和利益方向的发展过程
业务敏捷性改进:解释生命周期改进或改变的好处,改进延误成本的测量方法
业务质量:测量业务案件是否按期完成;基于新创建或集成的数据导致业务发生的改变,测量项目是否实际交付了这些变更。
业务操作质量:测量改进效率的方法,实例包括准确性改进、时间减少,由于数据错误而导致的纠错费。
业务环境改进:实例包括由于数据错误减少而改变的客户保留率和在递交报告中当局评论的减少率。