采用了hierarchy的架构,即两层encoder(rnn_size取200),分别代表word-level和sentence-level。
亮点在于,两层attention中都引入了user和product信息:
Wu和Wp分别将user vector 和 product vector 压缩到continuous dense vector(相当于user embedding 和 product embedding,200维),串联lstm encoder的隐状态,通过一个非线性激发函数后带上权重v(相当于一维fc),再通过softmax归一化即构成attention权重。
输出层没什么变化,tanh激发+softmax+crossentropy
评估:
总结:
本文的亮点就是把user embedding和 product embedding加入到attention中,从结构上来看, 对比传统的attention机制:
如果把对hidden cell的投影也看作embedding,那么就是在hidden embedding的基础上串联user embedding和 product embedding,再加上一层一维fc。引入product 和user信息的有效性,可以简述如下:
• 用户-情感一致性:某些用户倾向于打高分,有些打低分
• 产品-情感一致性:好产品得高分,坏产品得低分
• 用户-文本一致性:用户使用相同文本表达不同的感情
• 产品-文本一致性:相同文本评论不同产品代表不同的感情