IP属地:广东
马尔可夫性质(Markov Property): 如果某一个过程未来的转移跟过去是独立的,即只取决于现在,那么其满足马尔可夫性质。换句话说,一个...
基本概念1、策略PolicyPolicy是智能体的行为函数,是一个从状态到动作的映射,它告诉智能体如何挑选下一个action。强化学习中有两类p...
分类模型融合 关于Blending比stacking简单使用数据少,可能会过拟合其主要思路是把原始的训练集先分成两部分,比如70%的数据作为新的...
线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列...
缺失值处理 像IRIS数据集没有缺失值,故对数据集新增一个特征,4个特征均赋值为NaN,表示数据缺失;用均值、众数、中位数填充;用正态分布进行填...
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。 赛题以二手车市场为背...
训练集与验证集模型训练的过程其实就是在求【参数】的过程,我们先假定某类【模型】(比如决策树模型),然后用【训练集】来训练,学习到对应的最优的【参...