在数据成为企业核心竞争力的今天,如何高效、安全地管理并利用数据资产已成为企业面临的关键挑战。临研通集团,作为临床研究领域的深耕者,深知数据资产管理的重要性,为优化内部数据资产管理流程,提升数据利用效率,针对数据资产目录与索引做了分析与总结。数据资产目录是企业管理数据资产的一个重要元素,其目的是希望为企业提供了一个清晰、直观的数据资产视图。
数据资产目录是什么
我经常将书的目录与数据目录进行类比,翻开一本书的目录,它会告诉你这本书写了啥、内容结构、作者的写作思路等,如果你对某一章节感兴趣,通过目录就可以快速找到这想看的内容。图书目录起到提纲挈领,纲举目张的作用。
数据资产目录也一样,它也有都有“字典”的作用,能够帮助企业相关业务和技术人员快速定位数据,解释数据,找到数据,并从中提取业务价值。
除以上经济行为外,当数据持有人有提高内部管理水平、量化资产价值等需求时,也可对数据资产进行评估。
1、数据资产目录的本质
数据资产目录本质上就是一个元数据的存储库,它提供特定范围内所有数据资产的清单,无论其位置或来源如何。数据目录包括有关数据资产的关键属性信息,例如:名称、业务含义、类型、大小、模式和其他相关属性。
数据资产目录支持数据治理,包括:数据的分类分级,数据权限的管理,识别冗余和不一致的数据并为数据血缘分析和影响分析奠定了基础。
2、数据资产目录与数据目录
数据资产目录和数据目录本质上是一样的,都是元数据管理。
在项目实践中,数据目录也叫数据资源目录,一般是指通过元数据管理工具,对相关数据源(业务系统数据库、数据仓库、数据湖等)的元数据进行采集,而形成的数据目录。由于直接采集过来的基本都是数据库表结构、数据流、ETL脚本、数据库操作日志等技术元数据,所以数据目录要有一定的技术基础才能看懂,而且它的定位就是给技术人员看的。
而数据资产目录是数据目录的子集,更多是站在业务的视角,以利益相关者的数据需求为目标对那些预期能够为企业带来价值的数据进行分类分级,业务元数据定义、打标签,授权等。
数据资产目录特点?
区别于技术人员使用的数据字典,数据资产目录的定位是面向业务的,鼓励业务人员参与建设和使用十分关键,数据资产目录必须是业务人员所熟悉的场景和流程,是客观反映银行目前数据现状的,是可扩展的支持未来取数用数的。
一个使用友好的数据资产目录,能够打通查数/取数环节、打通基础类数据和指标类数据的联系,并通过人工智能和机器学习等先进技术,更好地支持数据的探查和关联推荐。
数据资产目录体系框架
我们在进行数据资产目录构建时,需要结合数据资产类型,定义数据资产的属性,不同资产类型对应不同业务属性,管理属性,应用模式、资产目录视角等,达到千数千面的效果,最终形成数据资产权威、可信、可用的企业级数据资产目录。
以业务领域构建资产目录为例,可以通过资产盘点,梳理银行数据主题分类/核心业务板块,再根据业务要素逐步向下划分二级目录、三级目录,最后到叶子结点的信息项上。信息项的定义也是从业务出发,梳理业务板块都有哪些数据内容,例如客户信息包括:客户名称、联系方式、地址、证件类型、证件号码等。
数据资产分布与映射关系建立
在技术元数据采集的基础上,探索信息项所属系统来源,确认其系统分布情况,将数据资产信息项与物理表/字段间构建映射关系,并确定权威数据来源。对于单个业务系统而言,只需要将主表中经过分析最准的内容映射过来,而不是所有表,避免数据使用者因为多表冗余存储造成混淆。
我们以“客户中文姓名”这一信息项为例,梳理数据来源与系统表映射关系如下:
数据资产目录的应用价值
通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。数据资产目录的准确性,也决定了应用时的效果。
数据在哪里:业务部门能够通过数据目录查询到现有数据资产情况以及索引对应的系统表字段,定位权威系统数据来源。
数据谁负责:在数据质量检核规则发现问题时,根据字段所属的数据资产来确定数据质量问题的牵头整改责任归属。
数据如何用:精准定位数据所在系统/表/字段,提升数据提取需求的准确性和效率;打通系统间形成的数据孤岛,实现编码规则等标准的统一规范、使数据互联互通。
小结
临研通致力于深耕数字经济领域,为企业数字化转型注入强劲动力。其创新采用去中心化的现场管理组织服务模式,这一模式犹如一股强劲的破壁之力,有效打破横亘在数据要素流通与交易之间的数据孤岛壁垒。通过促进数据资源的自由流动与规模化应用,成功激发了数据要素的乘数效应,让数据价值呈几何级数增长,为企业发展带来前所未有的数据红利。 此外,临研通的私有化部署系统堪称企业数字化转型的“加速器”。该系统能够迅速完成功能部署,使企业在极短时间内搭建起一套全面且合规化的管理系统。这不仅大幅削减了企业在系统开发与后期维护方面的成本开支,还为整个行业的数字化生态建设注入了活力。在临研通的推动下,数据要素市场化配置进程加快,行业数据资源得到更高效、合理的利用,为数字经济的蓬勃发展提供了有力支撑。