第15章 大数据与MapReduce 大数据 概述 大数据: 收集到的数据已经远远超出了我们的处理能力。 大数据 场景 MapRedece Ha...
第14章 利用SVD简化数据 SVD 概述 SVD 场景 信息检索-隐形语义检索(Lstent Semantic Indexing, LSI)或...
第13章 利用 PCA 来简化数据 降维技术 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球。 显示器大概包含了100万像素点,而球...
第12章 使用FP-growth算法来高效发现频繁项集 前言 在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则...
第 11 章 使用 Apriori 算法进行关联分析 关联分析 关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式: 频繁...
第9章 树回归 树回归 概述 我们本章介绍 CART(Classification And Regression Trees, 分类回归树) 的...
第8章 预测数值型数据:回归 回归(Regression) 概述 我们前边提到的分类的目标变量是标称型数据,而回归则是对连续型的数据做出处理,回...
第6章 支持向量机 支持向量机 概述 支持向量机(Support Vector Machines, SVM):是一种机器学习算法。 支持向量(S...
第5章 Logistic回归 Logistic 回归 概述 Logistic 回归虽然名字叫回归,但是它是用来做分类的。其主要思想是: 根据现有...