词向量的应用
第一种应用是找同义词。具体应用案例就是google的word2vec工具,通过训练好的词向量,指定一个词,可以返回和它cos距离最相近的词并排序。
第二种应用是词性标注和语义角色标注任务。具体使用方法是:把词向量作为神经网络的输入层,通过前馈网络和卷积网络完成。
第三种应用是句法分析和情感分析任务。具体使用方法是:把词向量作为递归神经网络的输入。
第四种应用是命名实体识别和短语识别。具体使用方法是:把词向量作为扩展特征使用。
另外词向量有一个非常特别的现象:C(king)-C(queue)≈C(man)-C(woman),这里的减法就是向量逐维相减,换个表达方式就是:C(king)-C(man)+C(woman)和它最相近的向量就是C(queue),
这里面的原理其实就是:语义空间中的线性关系。基于这个结论相信会有更多奇妙的功能出现。