监督学习的类型:
A.分类:这是一项有监督的学习任务,其中输出具有定义的标签(离散值)。例如,在上图A中,Output-Purched定义了标签,即0或1;1表示客户将购买,0表示客户不会购买。这里的目标是预测属于特定类别的离散值,并根据准确度对它们进行评估。它可以是二进制分类,也可以是多类别分类。在二进制分类中,模型预测0或1;是或否,但在多类分类的情况下,模型预测多个类别。例如:Gmail将邮件分类为多个类别,如社交、促销、更新和论坛。
B.回归:这是一个有监督的学习任务,其中输出具有连续值。例如,在上图B中,输出-风速没有任何离散值,但在特定范围内是连续的。这里的目标是预测一个尽可能接近实际输出值的值,然后通过计算误差值进行评估。误差越小,我们回归模型的精度就越高。
监督学习算法示例:
线性回归
物流回归
最近的邻居
高斯朴素贝叶斯
决策树
支持向量机(支持向量机)
随机森林
ML|学习类型--监督学习
监督学习是机器学习的一种类型,其中算法是在标记的数据集上训练的,这意味着输出(或目标)变量已经知道。有监督学习的目标是学习一个函数,该函数可以根据输入变量准确地预测输出变量。监督学习可以进一步分为两大类:
分类:在分类中,输出变量是分类变量,目标是预测新数据点所属的类别或类别。分类问题的例子包括图像分类、垃圾邮件检测和情感分析。
回归:在回归中,输出变量是一个连续变量,目标是根据输入变量预测输出变量的值。回归问题的例子包括预测股票价格、天气预报和销售预报。
监督学习算法在自然语言处理、计算机视觉、医学诊断、语音识别等领域有着广泛的应用。一些流行的监督学习算法包括:线性回归、Logistic回归、决策树、随机森林、k近邻(KNN)、支持向量机(SVM)和神经网络。
值得注意的是,当我们有标记的数据时,监督学习是有用的,但情况并不总是这样。在某些情况下,数据没有标记或标记成本太高,那么无监督学习、半监督学习或自我监督学习可能是更好的方法。