知识图谱的概念于 2012 年由 Google 提出,其发展还不算成熟,属于建立在多个技术领域上的一门实用技术。本文对知识图谱的构建以及知识图谱在深度学习中的应用进行分析,总结出该领域目前面临的困难和挑战具体如下:
1、知识图谱构建技术方面
(1)对于知识抽取技术,现有的实体关系联合抽取技术并未解决关系重叠问题,算法准确率和召回率都较低。除此之外,基于开放域的关系抽取还处于初级阶段,多语种、大范围的多元实体关系抽取是当前面临的主要困难之一,无监督关系抽取具有较高的可移植性和泛化性,为开放域关系抽取任务提供了新的思路。
关系重叠问题:一对多,比如“张学友演唱过《吻别》《在你身边》”中,存在2种关系:「张学友-歌手-吻别」和「张学友-歌手-在你身边」 ;一对实体存在多种关系,如“周杰伦作曲并演唱《七里香》”中,存在2种关系:「周杰伦-歌手-七里香」和「周杰伦-作曲-七里香」
(2)对于知识融合技术,实体对齐是最主要的手段,如何实现高质量的实体对齐、共指消解是一项巨大的挑战,开放领域下的实体对齐、共指消解以及多源数据库融合是当前主要的研究重点,如何在短文本情况下准确地将实体链接到知识库中亟需解决。小样本学习是最具潜力的研究方法之一,在计算机视觉中取得了较好的效果,使得模型具有高效的学习能力,将小样本学习应用于实体对齐具有重要的研究价值。
(3)对于知识推理技术,现有的知识推理技术大多只关注静态数据,忽略了时间信息,知识图谱的信息应该随着时间的推移而变化,因此,动态知识图谱推理还需要进行研究探索,如 EvolveGCN[93],其使用RNN 来演化 GCN 的参数,捕捉图序列的动态信息。除此之外,如何利用文本、音频、图像等多源信息来进行知识推理以及跨语言的知识推理,也是一个新的研究方向。
2、知识图谱应用于深度学习方面
目前,将知识图谱应用于深度学习还处于起步阶段,存在一些问题亟需解决,例如,知识图谱由点和边组成,符号化的知识在向量化后不可避免地会导致语义缺失问题,因此,如何对知识图谱进行高质量的表示仍是一个挑战。
3 结束语
作为知识工程的一个重要分支,知识图谱已经成为人工智能发展的核心动力和重要领域。本文对比分析知识图谱构建技术,讨论知识图谱与深度学习相结合的方法,并给出研究难点与潜在解决思路。从当前研究进展可以看出,将深度学习用于知识图谱构建已成为主流方法并取得了较好的效果,但无论是知识图谱构建还是深度学习,目前都存在着一些缺陷和挑战。在未来,基于深度学习的开放领域知识抽取、多源知识融合、动态知识推理,以及利用知识图谱弥补深度学习的某些缺陷,将是知识图谱领域的重要研究方向。