符号表示:
表示“输入”变量,也称为输入要素
表示我们试图预测的“输出”或目标变量
(,)被称为训练示例,我们将用于学习的数据集,称为训练集。请注意,符号中的上标“(i)”只是训练集的索引,与取幂无关。
我们还将使用X来表示输入值的空间,并使用Y来表示输出值的空间。例如,X = Y =R。
为了更加正式地描述监督学习问题,我们的目标是,在给定训练集的情况下,学习函数h:X→Y,使得h(x)是y的对应值的“好”预测器。由于历史原因,该函数h被称为假设。从图中可以看出,这个过程是这样的:
当我们试图预测的目标变量是连续时,例如在我们的住房示例中,我们将学习问题称为回归问题。 当y只能承担少量离散值时(例如,如果给定生活区域,我们想要预测住宅是房屋还是公寓),我们称之为分类问题。
x与y之间存在映射,由于变量只有x,故称为单变量线性回归。