MV-DSSM
解决的问题
- 解决用户冷启动问题
- 更深的user和item表达
- 同时学习不同域的item,user共享
创新点
- DSSM优化为multi-view dssm 学习多域item
- word hash方法降低输入文本的稀疏程度
word hashing
Given a word (e.g. good), we first add word starting and ending marks to the word (e.g. #good#). Then, we break the word into letter n-grams (e.g. letter trigrams: #go, goo, ood, od#).
Finally, the word is represented using a vector of letter n-grams.
以3-gram为例,将一个word前后加上#号表示首尾,每三个字母进行拆分得到 #go, goo, ood, od#再进行hash去模型中lookup embedding。