dssm以及变种

简介

优缺点

优点

  • DNN部分的所有权重都是共享的
  • wordhash能很好的对原始输入进行降维(500k->30k),而且能解决一些新词的问题
  • 利用了点击数据来进行有监督的训练

缺点

  • DSSM采用了词袋模型,损失了上下文信息
  • 无法加入更多的信息

变种

对DSSM的优化出现了很多的变种,有CNN-DSSM,LSTM-DSSM,MV-DSSM等。大多对隐藏层做了一些修改,原论文如下:

实践中的优化

-百度这个做了很多优化,比如框架架构、相似计算结构等等,此外,我们还发现字粒度下有很好的泛化性,能很好的弥补词粒度输入的不足,如切词的错误和未登录词 OOV 问题。百度NLP | 神经网络语义匹配技术

TODO

MV-DSSM其实是一个多模态+迁移学习,使用multi-view DNN模型构建推荐,包括app、新闻、电影和TV,相比于最好的算法,老用户提升49%,新用户提升110%。
参考链接:https://blog.csdn.net/shine19930820/article/details/78810984

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容