stack 栈 先进后出 队列 queue 单端队列 push 相当于push_backpop 相当于pop_front deque 双端队列 push_front, pop...

IP属地:上海
stack 栈 先进后出 队列 queue 单端队列 push 相当于push_backpop 相当于pop_front deque 双端队列 push_front, pop...
决策树 特征分裂点选取方法:遍历所有value,以该value作为切分点,计算左右集合的MSE,选取最佳切分点,同时切分样本到下层节点除了MSE之外也可以用信息增益(ID3算...
Q-Learning 行是state,列是action off-policy算法 ε-greedy贪心算法 Q更新公式如下:图片.png SARSA on-policy的更新...
强化学习的过程,分为模型训练和应用两部分。在应用阶段,模型的按照action的效果最大化进行输出结果。因此最优的action有最高的概率。训练阶段的目标是为了寻找全局最优解,...
1. Sigmoid函数 优点:取值在0-1之间缺点:容易出现梯度弥散现象 2. ReLU函数 优点:相比Sigmoid不容易出现梯度弥散现象缺点:x<0时,导数为0 3. ...
代码与笔记如下
https://zhuanlan.zhihu.com/p/84431551[https://zhuanlan.zhihu.com/p/84431551]https://blo...
Wide & Deep学习笔记 背景 用于推荐系统 平衡推荐的历史记录与泛化性 模型结构 Wide:memorization 输入: - 原始特征 - 交叉组合特征 (que...
准备工作 1. 下载Anaconda 2. 安装tensorflow tensorflow cpu版本安装 ``` pip install -i https://pypi.d...