CS229学习笔记(0)

CS229_0-监督学习

监督学习(Supervised Learning)

首先我们通过一些例子来讨论监督学习问题吧。假设我们有如下数据集:

我们可以将上述数据集绘制成如下图所示:

那么我们如何根据这些数据集预测其他房屋的价格呢?

为了今后更好地学习,以上例为例,我们将房屋面积定义为输入变量x^{(i)},其亦称为特征变量;将房屋价格定义为输出变量y^({^i}{^)},其亦称为目标变量;(x^{(i)}, y^{(i)})表示一个训练实例,其中上标i表示第i个训练实例;集合\lbrace (x^{(i)}, y^{(i)}); i = 1, \dots, m \rbrace表示训练集,其中m表示训练集的大小。

当然,我们也可使用\chi表示输入变量空间,Y表示输出变量空间。在房屋价格此例中,\chi = Y = R

在监督学习问题中,我们对给定的数据集,学习到一个函数h: \chi \mapsto Y, 该函数h(x)能够很好地预测目标变量。通常,我们将该函数h(x)称为假设函数(Hypothesis Function),其处理流程如下图所示:

当输出变量为连续值时,我们将其问题称为回归问题(Regression Problem);当输出变量为离散值时,我们将其问题称为分类问题(Classification Problem)。

补充:监督学习就是基于标记数据的学习。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容