Deep Learning over Multi-field Categorical Data

ctr预估

ctr中传统的FM,以神经网络的角度来看可以等效为下图:


FM

对比FM公式来看,第一项为图中最左边常数,第二项为每个field的权重,第三项为每两个field的交叉项权重且该权重可分解为两个k阶向量,相当于各个field二阶interaction的embedding。但显然这个结构与通常意义上的神经网络还是不一致的,所以作者提出了FNN,使得模型可以像神经网络一样反向传播训练。

FNN

FNN底层是一层多multifield embedding,其权重由FM预训练得到的各部分权重初始化。

细节:采用交叉熵作为损失函数,embedding层加l2正则或dropout,三层hidden选择diamond型的size进行tuning

overfit处理方法比较

总结:
论文的核心其实就是embedding的初始化,剩下的部分就是一个基本的deep模型,通过成熟的FM分解算法初始化latent权重,总感觉有点杀牛用鸡刀的感觉;但从另一个角度考虑,大部分的神经网络模型对向量之间的处理都是采用加法操作,而FM 则是通过向量之间的乘法来衡量两者之间的关系,乘法关系其实相当于逻辑“且”的关系,但是加法仅相当于逻辑中“或”的关系,显然“且”比“或”更能严格区分目标变量。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 改进神经网络的学习方法(下) 权重初始化 创建了神经网络后,我们需要进行权重和偏差的初始化。到现在,我们一直是根据...
    nightwish夜愿阅读 1,908评论 0 0
  • 改进神经网络的学习方法(上) 当一个高尔夫球员刚开始学习打高尔夫时,他们通常会在挥杆的练习上花费大多数时间。慢慢地...
    nightwish夜愿阅读 2,969评论 2 8
  • 月亮像海洋 海洋托着月光 平静又涌动 刹那间 潮汐像是饿狼要疾吞世界 零点零一秒之内的全面死亡 一转眼 又静的映照...
    灵犀Jing阅读 706评论 0 0
  • 事实上纠结了很久到底要不要写这篇年记。早早就想过用这样的标题来概括自己的2015年,大半的周末奔波于杭州和w两个地...
    秦旅阅读 361评论 1 1
  • LM5 大家好,一周已经过去一大半了,这几个晚上都很晚到家,家里人都睡着了,和宝贝只有早上的十分钟不到的交流,还因...
    sophia夏阅读 218评论 0 0