面对海量的数据报送需求和日益严格的监管要求,如何实现监管报送的全链路自动化数据质量保障,是金融机构亟待解决的重要课题。本文旨在介绍一种全新的监管报送场景方案,帮助金融机构通过“一键溯源与口径自动盘点、指标同源自动化分析、全链路主动协同保障”,全面提升监管报送的效率和质量。
作者|Aloudata 解决方案技术架构师王鑫鹏。
金融机构监管报送现状及问题分析
主流的监管报送类型涵盖 EAST(监管数据标准化)、1104 报表、客户风险系统报表、一表通等,报送流程从监管机构下发需求开始,经财会部门确认数据口径、业务 IT 团队明确数据来源表,再由数仓团队承接数据加工、完成报送数据结果给到监管团队,最终通过报送平台提交给监管机构。
整个流程中,金融机构最为关心两大问题:一是报送的及时性,即是否存在延迟;二是数据质量,即报送的数据是否被监管机构认定为错误。在我们与多家头部银行(包括国有大型商业银行、股份制银行、城市商业银行及农村商业银行)的交流中,我们发现,随着报送规则增多以及历史存量数据快速增长,企业数据链路复杂性日益增大,由此带来了以下问题:
盘不动:如何确认加工逻辑符合报送需求?
以某头部银行为例,其 800 张报送报表溯源出的源头表数量高达 15 万个,取值字段数量高达 2000 万个,链路长度在 10 层至 100 层之间。如此复杂度下,想要判断加工数据口径的准确性变得极为困难,因为需要通过人工对所有相关表进行逐一核查,工作量巨大,也难以实现持续“保鲜”。
对不上:监管要求对比不同规则指标,不一致怎么办?
当出现数据不一致的问题,金融机构通常还要进行数据对比,判断是不是业务系统来源不一致,或者加工口径不一致所引发,但在如此复杂的链路中,找出错误根因同样十分困难。
保不住:如何预知质量与时效风险,避免事后“擦屁股”?
在此复杂的架构下,链路变更引发事故的风险也相对较高。某头部银行拥有开发人员超 2000 人,每月变更投产任务次数高达 60,000 次。若监管团队使用的上游数据源存在较高的变更频率,且无法及时被通知,则很可能导致上线出错,影响监管报送的准确性和及时性。若上游数据源出于谨慎考虑,对所有变更均进行通知,还会导致协同效率问题,因为有些变更在中间层次已被消化,而监管团队由于无法确定是否需要响应,仍需进行逐层分析。
在近年来推广新一代监管一表通系统的过程中,我们发现这些问题有所加剧。一方面,新的监管规则已细化至流水级和明细级,且规则间的关系日益复杂。另一方面,若出现问题,所需改造的范围广泛,这对协同工作带来了巨大挑战。最后,当监管报送数据涉及到明细层时,金融机构需提前确保数据质量和时效性,不能同以前一样依赖在报送平台末端配置质量检查(DQC)来发现问题,因为这将导致无法及时纠正错误。
为解决这些问题,保障监管报送的时效性和数据质量,金融机构亟需一个更高效的方案,以提高数据盘点效率,增强数据比对准确性,并加强数据保障的前置性,让问题在事前或事中得到解决,而非事后。
Aloudata BIG 监管报送场景方案
方案一:一键溯源与口径自动盘点,精准定位问题根因、口径持续保鲜
我们首要解决的是“盘不动”的问题:一是数据取值来源的准确性,即从财会部门或业务 IT 系统获取的数据是否与预期一致;二是数据完整性,即是否成功获取了所有业务线的数据,避免遗漏;三是数仓加工过程的合规性,即加工口径是否符合预期,特别是数仓加工中可能存在的异常赋值问题。
异常赋值是指在某些特殊情况下,数据加工未使用源头数据,而是赋予了一个默认值。这种默认值在进行同源分析或溯源分析时,可能导致口径不一致的问题。
快速发现数据问题是盘点过程中的一个难点。由于数据链路复杂,涉及多个脚本和层级,若依赖人工逐层排查,将极大降低效率。以往经验表明,部分银行客户在进行数据盘点时,需动员上游五六个团队共同参与,逐层排查并整合信息,整个过程可能耗时一至两周,效率低下。
此外,该方式难以及时应对数据变更。若上游存在十层任务,其中任一任务发生变更,下游均无法即时感知并采取相应的口径盘点措施。即使下游在两周后得知变更并尝试进行盘点,若期间再次发生变更,将陷入反复盘点的困境。
针对“盘不动”的问题,我们提供了 Aloudata BIG 自动溯源盘点方案,主要具备以下三个特性:
一键溯源:企业仅需指定需溯源的报送指标或报送表,Aloudata BIG 即可自动向上追溯至各字段的源头来源表和字段,实现快速定位。
口径概括:在溯源过程中,Aloudata BIG 通过算子级血缘解析技术,能够将源头与溯源起点(即报送指标)之间的多层关系进行概括,便于用户理解数据链路。
自动保鲜:整个盘点过程是自动的,企业仅需指定目标字段或指标,Aloudata BIG 即可自动生成口径盘点结果并持续保鲜。一般情况下,盘点一个指标的时效为 5-10 分钟,若链路较短或加工逻辑不复杂,速度将更快。
这其中,口径概括包含取值口径和提取加工逻辑两个部分。取值口径指明了数据值来源于哪些表,提取加工逻辑能够将各段与溯源字段相关的加工逻辑简化为一句话描述,并逐层陈列。这样,既能快速查看取值口径,也能深入了解整个盘点过程。
我们还支持可视化分析。比如当前页面,我们会针对盘点结果,以图谱形式展示出每一层加工任务。最右侧表格为分析起点,整个溯源过程以此表为起点向上游追溯,左侧表格均为上游环节,直至追溯至源头字段。通过此方式,可清晰追溯字段来源及所经表格。有了这张图谱之后,点击具体字段还可查看和提取该字段的加工口径。这种对口径的提取能力是 Aloudata BG 自带的创新能力,构成了概括性分析以及智能化应用的基础。
在监管报送场景中,我们通过一键自动溯源及口径概括,并辅以可视化的逐层分析,既能快速输出结果,也便于深入观察具体细节,对问题精准定位具有显著作用。实施此方案后,原先存在的效率低、投入大及持续保鲜等问题均得以解决。
该方案在某客户的实践应用成效显著。以往,该客户习惯靠人工在 Excel 中创建映射,盘点过程耗时费力,难以每周、每月持续进行,只能在每个月组织动员时执行,后续的保鲜工作也无法保障。现通过本方案,自动完成上述任务,无需人工干预,自动输出结果,高效又准确。
方案二:指标同源自动化分析,全面解决监管数据不一致问题
接下来来解决“对不上”的问题,我们提供的是 Aloudata BIG 指标同源分析自动化方案。此方案具备两大特点:一是可直接提供对比组,便于对比不同指标,如 1104、EAST 及一表通等系统中的同源指标。其中,1104 系统提供汇总性指标,EAST 系统提供明细指标,一表通系统则可能兼顾两者。
二是我们能够将 1104、EAST 及一表通等系统中的同源指标进行整合对比。当监管报送过程中发现需对比的数据值存在差异且原因不明时,可运用此方案。为确保指标的可比性,首先需对 EAST 的明细数据进行汇总,然后与1104 的数据进行匹配,输入指定指标,即可发起一次对比,这样我们就能够获得一个对比结果。这个过程有点类似于溯源盘点过程,通过导出每个指标的来源字段、来源表及其取值口径,随后进行详细对比,以判断其来源是否一致,进一步分析口径是否一致及其原因。
在这个过程中,取值口径与完整口径需进行区分。取值口径因其简洁易懂,当内容出现差异,很容易识别出来。而对于汇总性指标,即便取值字段相同,由于条件(即行)不同,也可能导致数据值的不同。因此,需通过完整口径进行进一步比对。通过此方式,能将以往复杂的人工对比工作自动化,并支持多组指标的直接配置,因为监管要求报送的对比指标众多,逐一比对很是繁琐,所以将这些指标固定配置,并设置定期触发,能够大幅减少准备工作。
对于对比结果,基于我们的算子级血缘技术,准确度能达到 99% 以上,在这个基础上,该方案的对比结果可信度极高。所以,通过对比取值表字段、取值口径及完整口径等多个层次,该方案既能满足企业指标同源分析的需求,又能满足精细观察差异及问题排查的要求,从而全面解决监管数据不一致难题。
方案三:全链路主动协同保障,事前主动感知、分析与预警
最后要解决“保不住”的问题,主要通过我们提供的 Aloudata BIG 全链路主动保障方案来实现。
在以往,全链路协同保障存在若干问题:一是上游变更未及时通知下游。这可能是由于上游确实不了解下游受影响情况,缺乏可靠的影响分析工具,无法确定通知对象;也可能是由于上游缺乏相应意识,未意识到其变更会对监管报表产生影响。因此,当上游发生变更时,下游往往无法及时获知和响应,导致最终结果出现偏差。
另一问题是,上游有意识进行通知,即无论变更大小,均进行全面通知,导致全链路间通知泛滥。这种情况下,接收者每天会收到大量通知,难以判断哪些通知需要响应,哪些变更需要关注。
基于主动元数据管理能力,Aloudata BIG 能够直接监控元数据的变更,并能够与开发平台集成,捕捉元数据变更事件,与调度平台对接,捕获调度变更事件,以及结合质量检测时间进行全面分析。通过该方案,能够帮助企业实现主动变更分析、影响分析及根因分析。例如,当变更导致某个任务运行失败,借助该方案,我们能迅速定位失败原因,明确找出由哪次变更所致,最终分析生成链路风险报告,通知给监管团队等相关负责人。
当发现变更时,我们还会主动通知下游,形式可以是预警,也可以是协作邀请。算子级血缘能够精确识别上游字段在下游的具体使用情况,而非仅基于表或作业的依赖关系发起影响通知,如此一来,可大幅减少影响通知范围。再结合企业的一些开发工具和管理流程,就可以把整个协同工作转变为事前的主动感知、主动分析与主动预警。
例如我们在杭州银行的实践应用中,整个数据链路可通过一张算子级血缘图谱呈现,包含各种表及上下游关系,并针对重点链路进行智能打标。当上游发生变化时,我们利用血缘关系从源表一直追踪至监管指标乃至后续的 BI 报表,并通过元数据标签自动化扩散,不仅能够直接进行精细的影响分析,还减少大量的干扰与噪音。相较于事后或事中分析,这种事前全链路主动协同保障显著提升协同效率,并强化管控、通知及治理措施,实现重点链路变更自动化协同,问题根因分析提效 40%,影响面分析人天成本降低 50%。
综上,这就是我今天介绍的 Aloudata BIG 监管报送场景解决方案,针对性解决了企业监管数据及口径“盘不动、对不上、保不住”三大难题,助力金融机构实现监管报送不漏报、不错报、主动变更协同、口径持续保鲜。欢迎访问 Aloudata 官网,了解更多。