
IP属地:河北
一个口语理解系统(SLU)包括两部分,一个slot tagging model和一个以规则为基础的错误恢复模块。 在这个过程中只有ASR假设作为...
摘要 一句话总结:使用词向量来表示单词或短语;进而使用句子或者文档中单词或短语来表示它们的特征。 主要工作 词的上下文模型介绍: D是数据集,w...
摘要 最近连续Skip-gram model是一个效果不错的分布式高质量向量表示方法,他捕获了大量精确的语法和同义词之间的关系,本文提出了一种扩...
模型的目的是找到一种有效的可以预测句子或文档周围单词的词汇表征,公式化说明就是,给定一个训练序列w1,w2,w3,...,wT,模型的目的在于最...
层序softmax是另一种近似训练法。它使用了二叉树这一数据结构,树的每个叶结点代表词典V中的每个词。 图中,二叉树的每个叶节点代表着词典的每个...
摘要 提出了两种新的模型结构,用于计算非常大数据集中单词的连续矢量表示。这些表示的质量是在一个词相似性任务中测量的,并将结果与以前基于不同类型神...
核心问题 给定n个文本m个类别,将每个文本与类别建立对应关系。比如垃圾邮件分类问题,最简单的是二分类,将文本分为是否是垃圾邮件两个类别;再比如,...
摘要 针对大型英语文本简化过程中的删减现象,本文提出了一种数据驱动的研究,着重分析和预测句子的删减现象。作者收集了一个新的人工标注的句子对齐语料...