华中科大邹德清他所带领的研究团队开启了对利用SySeVR框架、多类漏洞检测系统μVulDeePecker、利用中间代码进行细粒度漏洞检测等基于深度学习的漏洞检测,及以启发式并发漏洞检测框架为代表的并发漏洞检测方面的探索和研究。
例如在多类漏洞检测系统μVulDeePecker的测试中,邹德清教授及其研究团队发现,现有基于深度学习的漏洞检测方法不适合直接用于多类漏洞检测,μVulDeePecker系统则具备一定的实用价值,而控制依赖及配合其他基于深度学习的检测系统使用则能够有效增强其在检测多种类型漏洞的能力。又如在利用中间代码进行细粒度漏洞检测方面,为应对其漏洞定位精度低、检测能力弱的问题,邹德清教授及其研究团队提出了利用中间代码捕获比源码本身更多的语义信息的思路,并创新性地改进了深度神经网络模型,将输入粒度提炼为更细的输出粒度方式。还如在并发漏洞检测中,针对当前主流技术手段的短板,邹德清教授介绍了启发式并发漏洞检测框架。其通过在模糊测试中不断调整线程调度,并专注于某个特定的线程调度反复测试触发,实现了检测效率的大幅提升。
目前,对于软件漏洞挖掘主要从源代码和二进制程序两个层次展开。其中面向二进制程序的漏洞挖掘,从其现实意义到实现难度都是源代码层无法比拟的。针对发现漏洞的最佳实践方式有源代码审查、模糊测试、基于规则的静态分析、基于规则的动态分析等,这些方法在特定情况下针对特定二进制程序可以产生很好的检测效果,但仍然存在一些很难突破的先天缺陷。
国内一家专注于AI技术在网络安全行业的应用与研究的高新技术企业极光无限推出了一款基于图神经网络的AI自动化漏洞挖掘系统 ——“维阵”,这款SAAS产品专注于二进制安全缺陷的快速发现;对二进制文件的程序流图(CFG)进行漏洞挖掘分析,着眼目标文件中的函数、库函数以及各种间接跳转,获得程序的控制流图的节点,结合反汇编出来的代码或者脚本语言,从而识别出可疑的汇编代码序列,进而快速有效地发现未知漏洞的一款自动化漏洞挖掘产品。
这款产品最大的特点就是图神经网络(GNN)将图论与深度学习相结合,突破了神经网络只能作用在欧式数据(Euclidean data)上的限制,把神经网络强大的特征提取能力扩展到非欧数据(non-Euclidean data)上,通过结果反馈和优化输入的生成过程以求产生更优秀更少的测试输入,达到加快挖掘效率,增加挖掘深度的目的。