数据治理
1. 介绍
数据治理的重点是如何对数据进行决策,以及期望人们和流程如何对待数据。特定的数据治理计划的范围和重点将取决于组织的需求,但大多数计划包括以下内容
- 策略:定义、沟通并推动数据战略和数据治理战略的执行
- 政策:制定和执行与数据和元数据管理、访问、使用、安全和质量相关的政策
- 标准和质量:制定和执行数据质量和数据结构标准
- 监督:在质量、政策和数据管理的关键领域提供实际观察、审计和纠正(通常称为管理)
- 合规:确保组织能够满足数据相关的合规要求
- 问题管理:识别、定义、升级和解决与数据安全、数据访问、数据质量、监管合规性、数据所有权、政策、标准、术语或数据治理程序有关的问题
- 数据管理项目:赞助改进数据管理做法的努力
- 数据资产估值:制定标准和流程,以一致界定数据资产的业务价值
2. 业务驱动力
减少风险
一般性风险管理:洞察风险数据对财务或商誉造成的影响,包括对法律和监管问题的相应。
数据安全:通过控制活动保护数据资产,包括可获得性、可用性、完整性、连续性、可审计和数据安全。
隐私:通过制度和合规性监控,控制私人信息、私密信息、个人身份信息等。
改进流程
法律遵从性:有效和持续地相应监管要求的能力;
数据质量提高:通过真实可信的数据提升业务绩效的能力;
元数据管理:建立业务术语表,用于定义和定位组织中的数据,确保组织中数量繁多的元数据被管理和应用。
项目开发效率:在系统生命周期中改进,以解决整个组织的数据管理问题,包括利用数据生命周期治理来管理特定数据的技术债。
供应商管理:控制数据处理的合同,包括云存储、外部数据采购、数据产品销售和外包数据运维。
3. 目标和原则
数据治理程序内容
- 可持续发展:它不是以一个项目作为终点,而是一个持续的过程,需要把它作为整个组织的责任。
- 嵌入式:数据治理不是附加管理流程,需要融合软件开发方法、数据分析应用、主数据管理和风险管理。
- 可度量:数据治理做到好友积极的财务影响,但要证明这一影响,就需要了解起始过程并计划可度量的改进方案。
数据治理原则
- 领导力和战略:数据战略指导数据管理活动,同时由企业业务战略所驱动;
- 业务驱动:数据治理是一项业务管理计划,因此必须管理与数据相关的IT决策,就像管理与数据有关的业务活动一样。
- 共担责任:在所有数据管理的知识领域中,业务数据管理专员和数据管理专业人员共担责任。
- 多层面:数据治理活动发生在企业层面和各地基层,但通常发生在中间各层面。
- 基于框架:由于治理活动需要跨组织职能的协调,因此对数据治理项目必须建立一个运营框架来定义各个职责和工作内容。
- 原则导向:知道原则是数据治理活动、特别是数据治理策略的基础。
4. 基本概念
以数据为中心的组织
以数据为中心的组织将数据作为资产估值,在生命周期所有阶段进行管理,包括项目开发和持续运营阶段。为达到以数据为中心,组织必须改变将战略转化为行动的方式。
- 数据应该作为企业资产管理起来
- 应该在整个组织内鼓励数据管理的最佳实践
- 企业数据战略必须与业务战略一致
- 应不断改进数据管理流程
数据治理组织
数据治理操作模型类型
集中:数据治理组织监督所有主题领域中的所有活动
复制:每个业务部门采用相同的数据治理操作模型
联合:一个数据治理组织与多个业务部门进行协调,以保持一致的定义和标准
数据管理职责 Data Stewardship
- 创建和管理核心元数据,包括业务术语、有效数据值及其他关键元数据的定义和管理。
- 记录规则和标准,包括业务规则、数据标准及数据质量规则的定义和记录。
- 管理数据质量问题,数据管理专员通常参与识别、解决与数据相关的问题,或者促进解决的过程。
- 执行数据治理运营活动,数据管理专员有责任确保数据治理制度和计划在日常工作或每一个项目中被遵循执行,并对决策发挥影响力,以支撑组织总体目标的方式管理数据。
数据资产估值
- 替换成本,在灾难性数据破坏事件或者数据中断时,数据替换或恢复的成本,包括组织内的交易、域、目录、文档和指标信息等。
- 市场价值:兼并或收购企业时作为企业资产的价值
- 发现商机:通过交易数据或通过售卖数据,从数据中发现商机获得的收入价值
- 售卖数据:一些组织为产品或销售将数据打包从数据中获得的洞察
-
风险成本:它是基于其在罚款、补救成本和诉讼费用的估价,来自法律或监管的风险包括:缺少必须的数据、存在不应留存的数据、除上述成本外,包括数据不正确造成客户、公司财务和声誉受到损害、风险下降或者风险成本的下降,其实是与提升和验证数据等操作干预成本的抵消之后的溢出部分
5. 规划组织的数据治理
数据治理必须支持业务战略和目标,成功的数据治理应当是清楚地了解需要治理什么、怎么治理以及谁来执行治理
执行就绪评估
评估当前组织的信息管理能力、成熟度和有效性,对于制定数据治理的计划至关重要,典型的评估包括:
- 数据管理成熟度:了解组织对数据的处理方式,衡量其当前的数据管理能力和容量,重点是业务人员对公司管理数据和利用数据的优势以及客观标准1(工具的使用、报告级别等)的印象。
- 变革能力:数据治理需要行为上的改变,因此测量组织为适应数据治理所需而改变行为的能力非常重要。
- 协作准备:该评估体现了组织在管理和使用数据方面的协作能力
- 与业务保持一致:通过业务一致性能力评估可以检查组织如何调整数据的使用来支持满足业务战略要求。
探索与业务保持一致
数据治理项目必须能够被找到并提供特定的价值来为组织作出贡献。通过评估活动将识别和评估现有制度、知道方针的有效性。数据质量分析师评估的一部分工作,通过数据质量评估可以洞察现有问题和障碍以及低质量数据影响,还可识别使用低质量数据执行业务流程存在的风险,以及作为数据治理工作组成部分的数据质量项目带来的财务和其他收益。
制定组织触点
协调工作的一部分包括数据治理工作制定组织接触点,包括采购和合同、预算和资金、法规遵从性、SDLC/开发框架。
6. 制定数据治理战略
应根据每个组织制定具体内容,交付物包括:
- 章程:确定数据管理的业务驱动愿景、使用和原则,包括成熟度评估、内部流程分析及当前问题和成功标准
- 运营框架和职责:定义数据治理活动的结构和责任
- 实施路线图:制定时间计划,其涉及最终发布的制度、指令、业务术语、架构、资产价值评估、标准和程序以及所期望业务和技术流程发生的改变、支持审计活动和法规遵从的交付成果。
- 为成功运营制定计划,为数据治理活动描述一个可持续发展的目标状态。
定义数据治理运营框架
- 数据对组织的价值:如果一个组织出售数据,显然数据治理具有巨大的业务影响力;将数据作为最有价值事务的组织将需要一个反应数据角色的运营模式;对于数据是操作润滑剂的组织,数据治理形式就不那么严肃了。
- 业务模式:分散式与集中式、本地化与国际化等是影响业务发生方式以及如何定义数据治理运营模式的因素。
- 文化因素:开展治理战略需要提倡一种与组织文化相适应的运营模式,同时持续地进行变革。
- 监管影响:与受监管程度较低的组织相比,受监管程度较高的组织具有不同的数据治理心态和运营模式。
制定目标、原则和制度
- 由数据治理办公室认证确认组织用到的数据
- 由数据治理办公室批准成为业务拥有者
- 业务拥有者将在其业务领域委派数据管理专员,数据管理专员的日常职责是协调数据治理活动
- 尽可能地提供标准化报告、仪表盘或记分卡,以满足大部分业务需求
- 认证用户将被授予访问相关数据的权限,以便查询即席报表和使用非标准报告
- 定期复评所有认证数据,以评价其准确性、完整性、一致性、可访问性、唯一性、合规性和效率等。
推动数据管理项目
推动数据治理项目关键是阐明数据管理提高效率和降低风险的方法,数据治理委员会负责定义数据管理项目的商业案例,监督项目状态和进度,还可以与企业范围内的大型项目集配合开展数据管理改进工作。
参与变革管理
- 规划:规划变革管理,包括进行利益相关方分析、获得支持以及建立能够克服阻力的沟通方法
- 培训:建立和执行数据治理项目培训
- 影响系统开发:与项目管理办公室合作,在软件开发生命周期中增加数据治理步骤。
- 制度实施:宣传数据制度和组织对数据管理活动的承诺。
- 沟通:提高数据管理专员和其他数据治理专业人员对自身角色和职责以及数据管理项目目标和预期的认知。
参与问题管理
问题管理是识别、量化、划分优先级和解决与数据治理相关的问题的过程,包括:
- 授权:关于决策权和程序的问题
- 变更升级管理:升级变更过程中出现问题的流程
- 合规性:满足合规性要求的问题
- 冲突:包括数据和信息中冲突的策略、流程、业务规则、命名、定义、标准、架构、数据所有权以及冲突中利益相关方的关注点。
- 一致性:与策略、标准、架构和流程一致性相关的问题
- 合同:协商和审查数据共享协议,购买和销售数据、云存储
- 数据安全和身份识别:有关隐私和保密的问题,包括违规调查
- 数据质量:检测和解决数据质量问题,包括灾难事件或者安全漏洞
开展数据治理需要在以下几个方面建立控制机制和流程:
- 识别、收集、记录和更新的问题
- 各项活动的评估和跟踪
- 记录利益相关方的观点和可选解决方案
- 确定、记录和传达问题解决方案
- 促进客观、中立的讨论,听取各方观点
- 将问题升级到更高权限级别
评估法遵循从性要求
- 与组织相关的法规有哪些
- 什么是合规性?实现合规性需要什么样的策略和流程?
- 什么时候需要合规?如何以及什么时候监控合规性?
- 组织能够采用行业标准来实现合规性?
- 如何证明合规性?
- 违规的风险和处罚是什么?
- 如何识别和报告不合规的情况?如何管理和纠正不合规的情况?
7. 实施数据治理
创建一个实施路线图,说明不同活动间的关系和整体时间框架,在联合数据治理组织中,根据不同业务线的参与程度、成熟度以及资金来源,可以在不同时间表上执行不同业务线的数据治理,有一些数据治理工作是基础性的,基础性分为初级阶段和持续阶段,高优先级的前期工作包括:
- 定义可满足高优先级目标的数据治理流程
- 建立业务术语表,记录术语和标准
- 协调企业架构师和数据架构师,帮助他们更好地理解数据和系统
- 为数据资产分配财务价值,以实现更好的决策,并提高对数据在组织成功中所起作用的理解
发起数据标准和规程
- 数据架构:包含企业级数据模型、工具标准和系统命名规范
- 数据建模和设计:包含数据模型管理程序、数据模型的命名规范、定义标准、标准域、标准缩写等
- 数据存储和操作:包括标准工具、数据库恢复和业务连续性标准、数据库性能、数据留存和外部数据采集
- 数据安全:包括数据访问安全标准、监控和审计程序、存储安全标准和培训需求
- 数据集成:用于数据集成和数据互操作的标准方法、工具
- 文件和内容:包含内容管理标准及流程,包括企业分类法的使用,支持法律查询、文档和电子邮件保留期限、电子签名和报告分发方法
- 参考数据和主数据:包括参考数据管理控制流程、数据记录系统、建立标准及授权应用、实体解析标准
- 数据仓库和商务智能:包括工具标准、处理标准和流程、报告和可视化格式化标准、大数据处理标准
- 元数据:指获取业务和技术元数据,包括元数据集成和使用流程
- 数据质量:包括数据质量规则、标准测量方法、数据补救标准和流程
- 大数据和数据科学:包含数据源识别、授权、获取、记录系统、共享和刷新
制定业务术语表
- 对核心业务概念和术语有共同的理解
- 降低由于对业务概念理解不一致而导致数据误使用的风险
- 改进技术资产与业务组织之间的一致性
- 最大限度地提高搜索能力,并能够获得记录在案的组织知识
协调架构团队协作
企业级数据模型应经数据治理委员会评审、批准并正式采用,与关键业务战略、流程、组织和系统保持一致性。在管理数据资产方面,数据战略和数据架构师在“做正确的事”与“正确的做事”之间协调的核心。
发起数据资产估值
数据治理委员会组织开展相关工作,并为此设置标准。可将价值评估过程构建在数据战略路线图中,以便为质量问题的解决方案以及其他治理方案的业务案例提供依据。
8. 嵌入数据治理
数据治理组织的一个目的是将治理活动嵌入到数据作为资产管理相关的一系列流程中,数据治理的持续运作需要规划。运营计划包含实施和运营数据治理活动所需的事件,其中包括维持成功所需的活动、时间和技术。
9. 工具和方法
数据治理从根本上讲是关于组织行为的,这不是一个可以通过技术解决的问题。但仍需要一些工具支持整个过程。