机器学习
- 通过问答这种方式已经无法区分对方是机器还是人类
- 利用现有经验E(Experience),不断改善其完成任务T(Task)的性能P(Performance)
Task
监督学习: 常用于对未知事物的预测,主要有分类问题,回归问题
无监督学习: 常有于对事物的特性进行分析,主要有数据降维、聚类问题
分类问题: 对事物类型进行预测,事物类型为离散且有限
回归问题: 预测目标常为连续变量
数据降维: 对事物特性进行压缩和筛选
聚类问题: 依赖数据的相似性,将相似数据分为一簇。不能预先知道簇的数量和含义
Experience
特征: 反映数据内在规律的信息
监督学习: 经验包括特征(特征向量描述的数据样本)、标记/目标(监督学习的分类)
无监督学习:没有标记/目标,无法从事预测任务,适合数据结构分析
训练集:既有特征又有标记/目标的数据集
测试集:为评价学习模型完成任务的质量,需要具备相同特征的数据,并将模型的预测结果同相对应的正确答案对比
训练集与测试集彼此互斥,测试集不能用于模型训练
Performance
用于评价完成任务质量的指标
分类问题: 用预测正确类型的百分百评价(准确性)
回归问题: 使用预测值和实际值之间的偏差大小