240 发简信
IP属地:北京
  • Resize,w 360,h 240
    Youtube DNN经典论文

    最近在看王喆的知乎专栏,第三、四、十三篇都是Youtube的经典论文DNN:https://zhuanlan.zhihu.com/p/52169...

  • DQN

    好久没写了,看了一下中间隔了居然有一个月,这种没有活水流入的生活,确实会让人feel bad; 这篇要讲到DQN,主要是Nature2015那版...

  • Q-learning和Sarsa

    Q-learning: 这里并不知道为啥每一轮都要初始化s,但是在每一轮需要采取动作的每一步(step)要做的事情如下: 根据epsilon-g...

  • Resize,w 360,h 240
    马尔可夫决策过程

    from:https://www.jianshu.com/p/295d7a8ebe48 都说要做强化学习先要搞明白马尔可夫决策过程,也还没明白为...

  • Resize,w 360,h 240
    linUCB

    通过上一节的zhihu链接明白了从这开始讲ee,以及后面讲rl的原因,都是源自这个zhihu专栏:https://zhuanlan.zhihu....

  • Resize,w 360,h 240
    EE基础 —— Bandit

    bandit基础看了一下并不是很难,先记录一下,文集里没有贴个公众号地址吧:https://mp.weixin.qq.com/s?src=11&...

  • Resize,w 360,h 240
    NCF

    参考:https://www.jianshu.com/p/6173dbde4f53 NCF全称Neural Collaborative Filt...

  • 再谈AUC

    文集里的下一篇是AUC,应该也是我看的第一篇了,重新看了之后,梳理了一些易忘的和以前没考虑过的,再拎出来写一下。 1.为什么AUC的最低值为0....

  • Resize,w 360,h 240
    PNN NFM AFM

    Deepfm是把FM和DNN并行了,但是其实FM和DNN还有一种串行模式,接下来要讲的这三种就是; 先说PNN,老规矩先放图(https://w...

个人介绍
就想找个地方安安静静地记点东西