机器学习从数据出发,通过学习数据,从而有更完善的表现。
机器学习过程
ML过程
示意图所示的机器学习过程正如Tom Mitchell在《Machine Learning》一书中提到的
机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能
适用机器学习的问题关键
判断一个问题是否可以用ML的方法进行解决,可以观察该问题是否满足下列三个关键
- 存在需要学习的"潜在模式"
- 很难用程序语言进行确切的定义
- 需要有关于模式的数据,作为ML的输入
通过实例了解机器学习
银行需要通过顾客的相关信息来决定是否给该顾客办理信用卡。因此我们可以得出以下定义
image.png
那么可以因此得到一个更为详细的ML流程图
image.png
- target function f 不可知
- g和f越接近越好
在这里我们可能会有很多种假设函数g,这些假设函数同属于一个假设集合H。而learning algorithm在于从数据出发,在假设集合中选取一个g,使得g和f接近。
image.png
通常将假设集合和学习算法独立出来,构成一个概念Learning Model
** Learning Model = H(hypothesis set) + A(learning algorithm) **
** 总结 **
机器学习跟数据密不可分,通常来说得到机器学习可以理解为将大量的训练数据输入到Learning Model中,从而得到一个假设函数g,该假设函数会比较接近实际但未知的目标函数f。通过得到的假设函数g,便可以针对下一次的输入,预测该输入所对应的输出。这便是我对机器学习的初步理解吧。