前面讨论了监督学习和无监督学习的基本原理,并探索了多种机器学习算法,本章我们深入学习模型评估与参数选择。我们将重点介绍监督方法,包括回归与分类,...
到目前为止,我们一直假设数据是由浮点数组成的二维数组,其中每一列是描述数据点的连续特征(continuous feature)。对于许多应用而言...
我们要讨论的第二种机器学习算法是无监督学习算法。无监督学习包括没有已知输出、没有老师指导学习算法的各种机器学习。在无监督学习中,学习算法只有输入...
2.3.5决策树 决策树是广泛用于分类和回归任务的模型。本质上,它从一层层的 if/else 问题中进行学习,并得出结论。这些问题类似于你在“2...
前面说过,监督学习是最常用也是最成功的机器学习类型之一。本章将会详细介绍监督学习,并解释几种常用的监督学习算法。我们在第 1 章已经见过一个监督...
机器学习(machine learning)是从数据中提取知识。它是统计学、人工智能和计算机科学交叉的研究领域,也被称为预测分析(predict...
在介绍各种机器学习方法之前,先看看究竟什么是机器学习,什么不是机器学习。机器学习经常被归类为人工智能(artificial intelligen...
机器学习在许多方面都可以看作是数据科学能力延伸的主要手段。机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既...
Python 有很多开发环境可供选择,我也常常被问起在工作中使用哪一种开发环境。我的答案有时会让人惊讶:我偏爱的开发环境是 IPython(ht...