DPLink:User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data

这篇文章要解决的问题是从不同结构的轨迹数据中找到相同的用户。(同一个人在不同平台都会产生数据,要根据不同平台上获得的数据来推断这是不是属于同一个人)

三大贡献:

1. 在构建embedding的地方使用了多模态的方式构建,有位置、时间、POI等辅助信息可以融合

2. 在Recurrent Encoder中,对中间隐层进行了pooling操作,使得序列数据embed到定长的向量中(针对每一维度,在所有时序数据的隐层中取最大)

3. co-attention selector,A,B轨迹对,将A的时序隐层表示 h_1->h_t与B的轨迹RNN表示(第二点中得到)做attention操作;同时,将B的时序隐层表示h_1->h_t表示与A的轨迹RNN表示做attention操作。获得A、B轨迹间的关联程度。

4.在单一数据集上先进行同一用户相近轨迹学习的预训练方法值得学习。

文章的不足:

1. 没有预训练,模型的效果就变得很差

2. 使用dot attention会不会过于简单?

3. 由于数据集限制,并未考虑到文本信息的嵌入(在结论中,作者提出的Future work)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 12,939评论 0 13
  • 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...
    我偏笑_NSNirvana阅读 14,772评论 2 64
  • 1. 关于诊断X线机准直器的作用,错误的是()。 (6.0 分) A. 显示照射野 B. 显示中心线 C. 屏蔽多...
    我们村我最帅阅读 13,691评论 0 5
  • 国家电网公司企业标准(Q/GDW)- 面向对象的用电信息数据交换协议 - 报批稿:20170802 前言: 排版 ...
    庭说阅读 13,846评论 6 13
  • 宝宝拉稀一定是生病了?这些错误家长需要避免! 宝宝的吃喝拉撒情况是家长们最关心的问题,因为这直接反映了宝宝的健康情...
    听雨心依阅读 955评论 0 0