一、什么是审计对象的数据画像?
数据画像,即基于企业信息数据开展大数据分析,通过将数据信息转化为画像元素勾画出审计对象业务信息的全貌,为审计人员进一步还原业务行为,精准、快速定位问题疑点提供了重要的信息支持。
在数据画像的过程中,审计人员将数据提炼为信息,为审计对象打上标签,标签通常是人为规定的高度精炼的特征标识,如时间、操作者、产品属性、客户属性、业务特征等,将审计对象的所有标签综合勾勒出立体的数据画像。
二、审计对象的数据画像方法
面对企业众多维度的原始数据,很多人认为数据画像的数据纬度越多越好,画像数据越丰富越好,某些输入的数据还被希望设定权重甚至建立模型,数据画像因此而变成了巨大而复杂的工程。
如何既让数据画像贴近业务,又规避较高的人力和成本投入呢?与审计项目结合是实现简单、干练数据画像的有效途径。
具体来讲,可以从以下三个方面考虑:
一是强相关信息为主。
强相关信息就是同审计项目直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。
数据画像和数据分析时,需要考虑强相关信息,减少考虑弱相关信息,这是快捷数据画像的有效方法。
二是尽量使用定性信息。
数据画像时要将定量信息归类为定性信息,数据画像的目的是为筛选出目标数据,定量的信息不利于对数据进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选数据。例如参考客户信息可以将客户定义为高、中、低级别。
将企业各类定量信息集中在一起,对定性信息进行分类,并进行定性化,有利于对数据进行筛选,快速定位疑似问题范围,这是数据画像第二个有效方法。
三是抓住关键信息。
利用审计人员的专业知识,识别关键信息并对审计对象画像。运用审计经验方法,从业务流程的关键时间节点,例如采购订单的审批日期、收货日期、结算日期等、供应商及客户的属性,例如状态信息、账户信息、姓名、邮件地址、家庭住址等。
通过对关键信息应用聚类分析、关联大数据分析技术,可以实现对审计对象的快速深入了解。
从审计视角在基础数据信息中提炼衍生信息,将审计工作重心从查错纠弊向为企业提供更高层次的咨询服务转变,使内部审计逐渐向国际内部审计标准靠近,落地实现内部审计在数据利用方面的优势。