一 机器学习概述
1.机器学习是什么:数据驱动,在数据上通过算法总结,应用在数据上。
二 机器学习例子
兴趣推荐,语音助手,AI,面部识别,无人驾驶。
三 机器学习基本概念
1.分类问题(监督) 根据样本特征判定有限类别
2.回归问题 (监督) 根据样本数据抽取的特征 预测连续结果
3.聚类问题 (无监督) 抽取特征值 得到关联
4.强化问题 (无监督)
基本术语和概念:
监督学习:有指导 无监督学习:无指导和参考
计算机视觉 模式识别 语音识别 自然语言处理 统计学习 数据挖掘
四 机器学习基本流程和工作环节
机器学习是围绕着数据和算法展开的(数据的质量)数据决定了上限 算法逼近了上限
数据驱动方法:数据+机器学习算法= 预测模型
数据预处理 模型学习 模型评估 模型上线
五 机器学习评估指标
1.机器学习目标 : 泛化能力强
2.留出法 : 留出测试集(数据一致性 多次随机划分 测试集适中)
3.k折交叉验证
4.自助法 :自助采样的方法 有放回的采样
5度量标准:
(1)性能度量 分类-错误率和精度(二分类混淆矩阵)
(2)回归类-均方误差
六 机器学习算法一览
总结: