1.什么是语言模型?
语言模型是描述自然语言概率分布的模型,是一个非常基础和重要的自然语言处理任务。利用语言模型,可以计算一个词或者一句话的概率,也可以在给定上下文的条件下,对接下来可能出现的词进行概率分布的估计。
2、如何评价一个语言模型的好坏
(1)外部任务评价:将语言模型应用到具体的任务中(如机器翻译),根据该任务上的指标高低对语言模型进行评价。计算代价高,难度大
(2)内部评价:基于困惑度的评价。其基本思想是:将数据划分为训练集(train)和测试集(test),此时两个集合中都是概率比较大的句子;使用训练集进行训练语言模型的参数,此时用训练好的语言模型计算测试集种句子的概率,更好的语言模型,在测试集上表现会更好。
测试集的概率为:
困惑度表示为:
句子概率越大,语言模型越好,迷惑度越小。