基于Hadoop和Mahout的K_Means算法设计与实现_王继重.caj
2.4Mahout
2.4.1Mahout的介绍
ApacheMahout是ApacheSoftwareFoundation旗下的一个开源项目,为机器学习领域经典算法提供可扩展的实现,作为一个优秀的开源平台,它可W辅助开
发人员开发程序。Mahout在0.5及上的版本加入了对ApacheHadoop的支持,
这是一个质地飞跃,借助Hadoop的并行计算能力,可W进行大数据分析和计
算。为了能够将数据挖掘算法更高效地运行在Hadoop环境中,当前的版本已经
提供了大量的算法开源实现。需要特别提出的是,Mahout并不是提供一个功能完
//