命名实体识别1

命名实体识别1

本文章集合用于记录自然语言处理中的命名实体识别任务,从小白到毕设的全过程。仅用于学习交流。

一、什么是命名实体识别

  • 命名实体(named entity)所谓的命名实体就是人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的实体还包括数字、日期、货币、地址等等.
  • 命名实体识别由3个问题组成:
    1.识别出文本中的命名实体;
    2.确定该实体的类型;
    3.对于多个实体表示同一事物时,选择其中的一个实体作为该组实体的代表。

二、资料参考

中文命名实体识别NER的原理、方法与工具 - 知乎 (zhihu.com)
注释:

  • 3.NER思想
    • 第一步:词实体标注
    • 第二步:单个实体识别
    • 第三步:复合实体识别
  • tips: token是什么?
    Token是服务端生成的一串字符串,以作客户端进行请求的一个令牌,当第一次登录后,服务器生成一个Token便将此Token返回给客户端,以后客户端只需带上这个Token前来请求数据即可,无需再次带上用户名和密码。即:令牌、标记、记号

三、命名实体识别方法

命名实体识别的发展过程概要如下:
早期是基于规则方法,接着是基于统计方法,然后是基于深度学习方法,到现在是基于Attention方法。


命名实体分类.jpg
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容