登录注册写文章

2022-01-23 第二章13 自然语言处理常见的三大任务之应用任务：信息抽取

2022-01-23 第二章13 自然语言处理常见的三大任务之应用任务：信息抽取

内容来自哈工大车万翔老师团队的作品《自然语言处理：基于预训练模型的方法》。

1. 信息抽取

信息抽取（Information Extraction，IE）是从非结构化的文本中自动提取结构化信息的过程。其结果还可以作为知识加入知识库。

1.1 命名实体识别（Named Entity Recognition，NER）

在文本中抽取每个提及的命名实体并标注其类型。包括人名、地名和机构名等，也包括专有名称等。
实体链接（Entity Linking）：在文本中找到提及的命名实体后，将这些命名实体链接到知识库或知识图谱中的具体实体。

1.2 关系抽取（Relation Extraction）

用于识别和分类文本中提及的实体之间的语义关系，如夫妻、子女、工作单位和地理空间上的位置关系等二元关系。

1.3 事件抽取（Event Extraction）

从文本中识别人们感兴趣的事件以及事件所涉及的时间、地点和人物等关键元素。
事件的发生时间往往比较关键，时间表达式（Temporal Expression）识别也是重要的信息抽取子任务，一般包括两种类型的时间：绝对时间（日期、星期、月份和节假日等）和相对时间（如明天、两年前等）

原文

抽取结果

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

禁止转载，如需转载请通过简信或评论联系作者。

相关阅读更多精彩内容

自然语言处理(NLP)一些任务的总结
本节总结一下NLP中常见的任务，从一个全局观来看看NLP：一：词法分析分词 (Word Segmentatio...
奔向算法的喵阅读 22,952评论 1赞 24
自然语言处理基础技术之命名实体识别简介
声明：转载请注明出处，谢谢：https://www.jianshu.com/p/02b08ff8ad3c另外，更多...
yuquanle阅读 2,130评论 0赞 1

自然语言处理资源大全
https://github.com/HIT-SCIR/pyltp http://ltp.readthedocs....
城市中迷途小书童阅读 728评论 0赞 4
自然语言处理资源大全
https://github.com/HIT-SCIR/pyltp http://ltp.readthedocs....
readilen阅读 1,852评论 1赞 6
2022-01-05 第二章8 自然语言处理常见的三大任务之基础任务：中文分词
内容来自哈工大车万翔老师团队的作品《自然语言处理：基于预训练模型的方法》。 1. 中文分词词（Word）是最小的...
于AI采风阅读 560评论 0赞 1

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文