数据在机器学习中起着重要的作用。
在谈论数据时,理解和使用正确的术语非常重要。 你如何看待数据?想想电子表格吧,有列、行和单元格。
从统计视角而言,机器学习的任务是在假设函数( f )的上下文中构建数据。这些假设函数由机器学习算法通过学习建立。给定一些输入变量( Input ),该函数回答了预测输出变量( Output )是什么的问题。
输出= f (输入)
输入和输出可以称为变量或向量。
计算机科学使用一行数据来描述一个实体(比如一个人)或一个实体的观测结果。因此,某一行的所有列通常被称为观测的属性,行本身被称为实例。
在下一课中,你将会发现所有机器学习算法都遵循的原理。