交叉验证
1、模型优化 (针对验证集) 测试集考试
信息熵 越小越纯 越大越不纯 最小为0
ent entorpy 信息熵
信息增益:划分前的信息熵-划分后的信息熵 一般用的信息增益
越大 纯度提升的越多
ID3决策树 不是二叉树 类似于多叉树
分裂信息:每个节点的占比
基尼系数:越大 数据越混乱 越小越纯
当前类别占比 *不是当前类别的占比
支持向量机:svm
分类、回归问题 一般做分类
超平面 :线性模型
1998 cnn lenet
2006 hinton dbn
2015 图像识别
硬间隔
软间隔
s.t 约束条件 分类超平面