事件抽取与事件图谱构建—中科院陈玉博老师
https://www.bilibili.com/video/BV19h411U7VJ?from=search&seid=2618389708902040551&spm_id_from=333.337.0.0
一、知识图谱
知识图谱是下一代人工智能的基础设施,是实现可解释人工智能的重要手段。
现有知识图谱都是以实体为核心,缺乏事件知识。
事件图谱的意义:
(1)丰富现有的知识图谱
(2)支撑其他信息获取引擎
(3)检测相关事件
(4)预测风险事件
(5)梳理历史事件
二、事件的定义
事件是发生在某个特定的时间点或时间段、某个特定的地域范围内,由一个或多个角色参与的一个或者多个动作组成的事情或者状态的改变。
从三个方面去理解:
(1)不同的动作或者状态的改变代表不同类型的事件;
-------比如特朗普就任或卸任就是两个事件。
(2)同一类型的事件中不同的元素代表了不同的事件实例;
------比如,都是美国总统当选,特朗普和拜登当选代表了不同的事件实例。
(3)同一个类型的事件中不同粒度的元素代表不同粒度的事件实例。
------比如第二次世界大战 抗日战争 松沪会战
三、事件图谱构建的关键技术
(一)事件抽取
1.事件抽取的定义
从自然语言文本中抽取出用户感兴趣的事件信息,并以结构化的形式呈现出来,如什么人/组织,什么时间,在什么地方,做了什么事。(抽取模板)
2.事件抽取的相关任务
(1)事件发现(Event Detection)
从文本中发现事件触发词(Event Trigger)
(2)事件元素抽取(Argument Extraction)
从文本中识别事件元素(Event Argument )并判断元素扮演的角色(Argument Role)
这里面“合并”就是一个触发词
(二)事件关系抽取
例子:
----共指关系:一个事件由多篇文章,多条句子来描述,事件不同的侧面,事件多个不同的元素,对事件元素的补齐有重要的意义
----因果关系:先后相继,有因有果的关系,对于文本的深层语义有重要的作用,有助于了解事件演变的整个过程,帮助决策者进行决策
----时序关系:时间上的先后关系,不仅厘清事件的先后关系,也能构建出事件的整个场景的知识,为后续的应用提供支撑
三、事件抽取经历的阶段