有很多典型的归纳学习问题。它们之间的主要区别在于它们试图预测的是什么类型的东西。这里有一些例子:
回归(Regression): 试图预测一个真实值。例如,根据过去的情况,预测股票明天的价格。或者根据爱丽丝(关于Alice 稍后会介绍她的前世今生)的家庭作业分数,预测她在机器学习期末考试中的分数。
二分类(Binary Classification): 试图预测一个关于“是或不是”简单的响应。例如,预测爱丽丝是否会喜欢上一门课。或者预测用户对最新苹果产品的评价是对产品的正面还是负面的评价。
多类分类(Multiclass Classification): 尝试为一个样例在多个类别中寻找它的类别。例如,预测一个新闻故事是关于娱乐、体育、政治、宗教等,还是预测一个课程类型是系统、理论、人工智能还是其他。
排序(Ranking): 试图将一组对象按相关性排序。例如,为了响应用户的查询,预测查询结果在显示时的排序。或者预测爱丽丝对课程的偏好程度。
由于他们试图预测的对象类型的类型而导致机器学习问题的原因很容易,这与测量误差有关。回想一下,我们的目标是建立一个能够做出“好的预测”的系统。这就引出了一个问题:预测“good”意味着什么?“不同类型的学习问题在他们如何定义善良方面有所不同。例如,在回归中,预测股价为0.05美元的股票价格可能要比在200美元时便宜很多。同样的,不包含多类分类。在那里,意外地预测“娱乐”而不是“体育”并不比预测“政治”更好或更糟糕。
如果可以,请对于每一类典型的机器学习问题,留言一个或两个具体的例子。