自动摘要

三种方法:
    1. 摘要生成器将句子按照重要性或者文档中心性排序。如果某个句子和文档中很多句子相似,那么它包含很多句子的公共信息,是一个不错的候选句子。
    1. 可能考虑到句子在文档中的位置、所含词的相关系及是否包含一些关键词‘综上所述、总结等’。词频可以采用TF-IDF来制定单词和文档的相关性。
    1. 计算所有句子的一个伪句子,然后计算离该中心句那些近的句子。

干货|当深度学习遇见自动文本摘要,seq2seq+attention

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转载自http://www.cnblogs.com/Determined22/ 两周以前读了些文档自动摘要的论文,...
    nightwish夜愿阅读 10,683评论 0 6
  • 背景 大数据时代,信息爆炸?垃圾遍地! 互相复制的新闻重复推送的广告大量冗余无效的信息 所以需要筛选信息,通过文本...
    AntiGravity阅读 400评论 0 0
  • 所谓自动摘要,就是从文章中自动抽取关键句。何谓关键句?人类的理解是能够概括文章中心的句子,机器的理解只能模拟人...
    famiking阅读 4,229评论 0 2
  • 转载 序 文本摘要是自然语言处理中比较难的一个任务,别说是用机器来做文摘了,就连人类做文摘的时候都需要具备很强的语...
    readilen阅读 8,508评论 1 10
  • 转载 序 文本摘要是自然语言处理中比较难的一个任务,别说是用机器来做文摘了,就连人类做文摘的时候都需要具备很强的语...
    城市中迷途小书童阅读 536评论 0 2