关键词提取

关键词提取算法

  • 有监督
  • 无监督

有监督

通过分类的方式进行,通过构建一个较为丰富和完善的词表,然后判断每个文档与词表中每个词的匹配程度,以类似标签的方式,达到关键词的提取效果。

优缺点

  • 能够获取到较高的精度
  • 需要大批量的标准数据,人工成本过高
  • 每天的信息量增加过多,会有大量的新信息出现,一旦固定的词表有时将很难将新信息的内容表达出来,但是要人工维护这个受控的词表却要很高的人力成本。

无监督

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容