2021-05-09 ch11 语言模型

语言模型:用于判断一句话是否语法通顺
给已经训练好的语言模型可以对任何一个文本给出概率,概率越高说明语法上越通顺

链式概率 P(今天是周日) = P(今天)P(是|今天)P(周日|今天,是)
语言模型会算好 P(今天)、P(是|今天)、P(周日|今天,是) 每一项的概率值是多少

问题:当句子非常长的时候,语料库很少有相同的句子,很容易出现P=0的情况

马尔可夫假设:当前中心词只考虑前面N个单词的条件概率
马尔科夫假设(1阶、2阶、3阶。。。对应 N = 1、2、3)


image.png

一阶马尔可夫假设:Bigram
第一个 P(w1)= 词频 / 语料单词数


image.png

【总结】
语言模型的概率值可基于语料库来统计
根据使用的马尔科夫假设的不同,可以把语言模型分为unigram, bigram, trigram, ngram。。。
当考虑多个单词的时候,条件概率往往变得稀疏,导致大部分都变成0。

【评估】困惑度,阶数越大,模型越复杂,困惑度越小,越准确也越过拟合


image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、基础知识 1、链式法则(chain rule):P(ABCD)=P(A)·P(B|A)·P(C|AB)·P(D...
    小小白的波妞妞阅读 1,084评论 0 0
  • 假设现在语料库的词汇量为,对于长度为的句子来说: 通过上面的表格可以看出,增加条件概率中的条件相对应的参数数量会呈...
    iChenkc阅读 2,109评论 0 0
  • 一、StatisticalLanguageModel 在自然语言处理中的一个基本问题:如何计算一段文本序列在某种语...
    布口袋_天晴了阅读 19,335评论 0 8
  • 做一名知识的搬运工 介绍 语言模型(LM)是很多自然语言处理(NLP)任务的基础。语言模型是指对于语言序列,计算该...
    612twilight阅读 5,128评论 0 2
  • 文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常...
    LinuxLeeSinYY阅读 641评论 0 0