外来务工闲杂人等

IP属地：北京

Youtube DNN经典论文
最近在看王喆的知乎专栏，第三、四、十三篇都是Youtube的经典论文DNN：https://zhuanlan.zhihu.com/p/52169...

1245 0 0
DQN
好久没写了，看了一下中间隔了居然有一个月，这种没有活水流入的生活，确实会让人feel bad；这篇要讲到DQN，主要是Nature2015那版...

522 0 0

Q-learning和Sarsa
Q-learning：这里并不知道为啥每一轮都要初始化s，但是在每一轮需要采取动作的每一步（step）要做的事情如下：根据epsilon-g...

448 0 0
马尔可夫决策过程
from：https://www.jianshu.com/p/295d7a8ebe48 都说要做强化学习先要搞明白马尔可夫决策过程，也还没明白为...

358 0 0
linUCB
通过上一节的zhihu链接明白了从这开始讲ee，以及后面讲rl的原因，都是源自这个zhihu专栏：https://zhuanlan.zhihu....

703 0 0
EE基础 —— Bandit
bandit基础看了一下并不是很难，先记录一下，文集里没有贴个公众号地址吧：https://mp.weixin.qq.com/s?src=11&...

642 0 0
NCF
参考：https://www.jianshu.com/p/6173dbde4f53 NCF全称Neural Collaborative Filt...

726 0 0

再谈AUC
文集里的下一篇是AUC，应该也是我看的第一篇了，重新看了之后，梳理了一些易忘的和以前没考虑过的，再拎出来写一下。 1.为什么AUC的最低值为0....

1117 0 0
PNN NFM AFM
Deepfm是把FM和DNN并行了，但是其实FM和DNN还有一种串行模式，接下来要讲的这三种就是；先说PNN，老规矩先放图（https://w...

353 0 0