喂给算法大量数据,训练出模型
- 给算法大量数据,让算法在数据中寻找规律(关系),从而执行智能任务
- 不确定世界中的真实问题,与经典问题相比,没有标准答案
- 机器学习:特征到目标之间的映射关系
- 应用:数据分析、海量数据、语音识别、图片识别
基本概念
基础+调包
经典算法,看看怎么用Scikit-learn调包
深度学习是机器学习的分支
使计算机通过层次概念来学习经验和理解世界
关键特征、关键参数
监督学习
监督学习:训练数据拥有“标记”
分类classfication:将预测结果离散为类别
具体类别
离散
特征feature(输入) ——处理——>标签 (输出)
回归regression
具体数值
连续
非监督学习
无监督学习:训练数据没有任何“标记”
聚类
关联分析
PCA
对没有标记的数据进行分类——聚类分析
足迹—>分类—>标记
对数据进行降维处理(赛选)
特征提取:信用卡的信用评级和人的胖瘦无关?
特征压缩:PCA算法,高维——>低微(保证质量)
——>方便可视化、异常检测
半监督学习
一部分数据有标记、另一部分没有
标记缺失
先无监督学习,在监督学习
增强学习
交互,行动,反馈(激励)
无人驾驶、机器人
数据
数据集、样本、特征(属性),标记
——数据数字化
向量约定小写、列向量
X大写—矩阵,y小写—向量
机器学习哲学思想
数据量越大,算法准确性越高
数据即算法?
简单的就是好的,不要有过多假设、不要过多复杂化
脱离具体问题,谈论那个算法好是没有意义的
具体问题多个算法对比试验,是必要的——找到合适算法!
面对不确定的世界,怎样看待使用机器学习进行预测结果?
大写矩阵、小写向量
图灵测试
人工智能发展历程
弱人工智能与强人工智能
- 弱人工智能是擅长于单个方面的人工智能
-
强人工智能:人类级别的人工智能。在各方面都能和人类比肩,人类能干的脑力活它都能干。
人工智能、机器学习和人工智能
人类自己设计特征 vs 特征自己学习