1、模型结构。类似cbow,中间预测的不是词而是label。输入->隐藏层->输出层。输出的是预定类别的概率分布。
2、层次softmax。目标tag是叶子节点。类似Huffman树。缩短计算时间。
3、bag of N-gram特征。为了获取局部词语顺序。
1、模型结构。类似cbow,中间预测的不是词而是label。输入->隐藏层->输出层。输出的是预定类别的概率分布。
2、层次softmax。目标tag是叶子节点。类似Huffman树。缩短计算时间。
3、bag of N-gram特征。为了获取局部词语顺序。