论文:http://www.aclweb.org/anthology/P16-1073
将句子改写应用在语义分析上。
问题
语义分析存在的主要问题是原始自然语言与目标本体之间的错配问题。`
模型
利用句子改写,将句子改写成与目标本体结构一致的句子。
两个改写模型来解决两类错配。
(注:错配不是看单词个数,而是看是否有逻辑&)
基于字典的模型来解决1-N错配
1-N错配
daughter->child&feamale
基于字典的模型
利用单词在字典里的解释来对单词进行改写。字典会用单词的多个含义以&的形式来解释这个单词。
只改写普通名词。
基于模板的模型来解决N-1错配
N-1错配
how many people&live in->population
基于模板的模型
模板其实也是规则,是改写pair对规则。
用WikiAnswers paraphrase语料来构建模板,并过滤掉相同词个数<=3的。
框架
一个句子,会有多个改写结果,继而会有多个目标本体,然后在多个目标本体中选择最优的目标本体。
挑选最优目标本体模型
排名函数来综合选择最优的改写和正确结构
语义分析模型会给出一个分值
其中参数可以这样学到
总体评分函数
其中
表示句子改写的得分
其中的参数用以下方式训练得到
表示语义分析的得分
其中的参数用以下方式训练得到
这两个参数同时更新
看论文时的疑问
句子改写的训练数据如何准备
基于字典与模板的模型都相当于是规则,不用训练数据去训练模型
如何判断是否与目标主体结构一致
直接是用总体评分函数来选择最优的目标本体,跳过了中间的判断是否结构一致的问题。