一 概念
1.1 范畴
人工智能 > 机器学习 > 深度学习
1.2 机器学习
- 有输入输出数据的情况下寻找合适的函数。
input -> f() -> output
机器学习就是解出最合适的f - E T P 在一个Task下,随着E的增多,P也在增大。以P为衡量标准,从E中找到解决T的最佳方案。
1.3 机器学习分类
- 监督学习 有标签
-- 分类
== 二分类
== 多分类
== 多标签分类
== 多输出分类
-- 回归 - 半监督学习 部分有标签
- 无监督学习 无标签
- 迁移学习 解决类似问题
- 强化学习 交互式
1.4 机器学习步骤
定义模型(一系列函数) -> 定义衡量模型好坏的方法 -> 以2为标准衡量1,不断重复,得到最佳函数
1.5 欠拟合和过拟合
欠拟合 在训练集上表现不好
过拟合 在测试集上表现不好
1.6 数据集
分类
- 训练集
- 验证集
- 测试集
样本 一条数据
标签 样本中认为是标注的项
过程
- 训练、学习 -> 训练集、验证集
- 推理、预测 -> 测试集、其他数据
函数
- 最佳函数 最终选的函数-
- 代价函数 定义模型的好坏
标准
评估标准 模型选择
测试标准 泛华性能