240 发简信
IP属地:香港
  • Resize,w 360,h 240
    Reinforcement Learning 重要性采样和Prioritized Experience Replay

    今天详细阅读了Prioritized Experience Replay这篇论文,记录下心得体会。 Introduction online RL...

  • Resize,w 360,h 240
    论文阅读:Graph Convolutional Reinforcement Learning

    这篇论文主要介绍了DGN的算法,在DQN的基础上加了图网络,用于状态的融合。在多智能体环境下运用。relation kernel用的是self-...

  • 稀疏矩阵的4种存储方式

    COO[https://www.geeksforgeeks.org/sparse-matrix-representation/]CSR[http...

  • Resize,w 360,h 240
    GCN在推荐系统中的应用之GraphSage-based

    GraphSage GraphSage是在论文Inductive Representation Learning on Large Graphs...

  • Resize,w 360,h 240
    GCN在推荐系统中的应用

    图网络(graph neural network, GNN) Category: Recurrent Graph Neural Networks...

  • 为什么在分类问题中常用交叉熵而不是MSE或者平均误差?

    交叉熵可以在得到正确结果的同时衡量模型的好坏; 交叉熵在模型不能很好拟合的似乎求的偏导大,而模型拟合的差不多之后偏导变小。对比之下,MSE在训练...

  • 2020-12-07读论文:A Heterogeneous Graph Neural Model for Cold-start Recommendation

    这篇文章的主要贡献点在于通过user-item interactions建立interactive graph,通过social network...

  • Resize,w 360,h 240
    2020-12-03 - 2020-12-06 京东RL论文整理

    把京东系的强化学习的论文复习整理一下。 读论文:Recommendations with Negative Feedback via Pairw...

  • Resize,w 360,h 240
    2020-12-02学习笔记

    读论文:Reinforcement Learning to Rank in E-Commerce Search Engine: Formaliz...