最近看吴恩达的机器学习视频,记录一下监督学习的个人理解
一、监督学习
监督学习有个显著的特征,就是你的数据需要人工标注,例如要做手写识别的机器学习,你的训练集必须经过标注。例如一张表示数字1的图片,对应的标注(labels)必须是1。
1、回归问题
回归问题一般求解是一个连续的值
上图是一个房价预测模型,表示房价的高低与房屋的平方数的关系。通过点状数据,我们可以统计出一个线性方程,例如房价Y = 2x + 10 (x表示平方数)。
这就是一个回归问题,我们可以输入不同的X得到不同的Y,Y的结果是一个连续的值。
2、分类问题
分类问题一般求解是一个离散的值
什么是离散?例如要判断一个图片是猫还是狗,结果只有两个,要么是猫,要么是狗,不会有一半时猫,一半是狗这个结果的。
上图是一个患恶心肿瘤与肿瘤大小的关系,根据上图的数据,恶性肿瘤和肿块大小并非线性关系。
我们只能采用分类,例如肿块小于5cm,较大可能为良性肿瘤,肿块大于5cm,较大可能为恶性肿瘤。