今天推荐的图书专注机器学习主题,一共7本,都是经过实践检验的好书——《机器学习》《图解机器学习》《机器学习实战》《机器学习系统设计》《Spark机器学习》《Mahout实战》《机器学习实践:测试驱动的开发方法》。
PS:《机器学习》是新书,刚刚上市,英文版评价非常棒,【阅读原文】放上了京东的购买链接。
本文选自“图灵教育”微信,关注我们的微信有赠书活动,不要错过哦~
1、入门1:全面经典【Machine Learning: The Art and Science of Algorithms that Make Sense of Data】
作者:Peter Flach
译者:段菲
页数:312
被誉为内容最全面的机器学习指南,Machine Learning期刊总编Peter Flach力作
数百个精选实例和解说性插图,汇集所有用于理解、挖掘和分析数据的先进方法
《机器学习》是迄今市面上内容最为全面的机器学习教材之一,书中汇集了所有用于理解、挖掘和分析数据的先进方法,并且通过数百个精选实例和解说性插图,直观而准确地阐释了这些方法背后的原理,内容涵盖了机器学习的构成要素和机器学习任务、逻辑模型、几何模型、统计模型,以及矩阵分解、ROC分析等时下热点话题。
2、入门2:最易上手【イラストで学ぶ 機械学習】
作者:杉山将
译者:许永伟
页数:240
最简单的机器学习入门书,187张图轻松入门
覆盖机器学习中最经典、用途最广的算法
提供可执行的Matlab程序代码
《图解机器学习》用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种无监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。
3、实战1:最受欢迎【Machine Learning in Action】
作者:Peter Harrington
译者:李锐 李鹏 曲亚东 王斌
页数:332
最畅销机器学习图书
介绍并实现机器学习的主流算法
面向日常任务的高效实战内容
《机器学习实战》通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。
4、实战2:必应团队教你ML系统设计【Building Machine Learning Systems with Python】
作者:Willi Richert,Luis Pedro Coelho
译者:刘峰
页数:224
微软Bing核心团队成员推出
聚焦算法编写和编程方式
结合大量实例学会解决实际问题
《机器学习系统设计》将向读者展示如何从原始数据中发现模式,首先从Python与机器学习的关系讲起,再介绍一些库,然后就开始基于数据集进行比较正式的项目开发了,涉及建模、推荐及改进,以及声音与图像处理。通过流行的开源库,我们可以掌握如何高效处理文本、图片和声音。同时,读者也能掌握如何评估、比较和选择适用的机器学习技术。
5、实战3:Spark + ML【Machine Learning with Spark】
作者:Nick Pentreath
译者:蔡立宇 黄章帅 周济民
页数:240
当机器学习遇上最流行的并行计算框架Spark
以机器学习算法为主线,结合实例探讨Spark的实际应用
《Spark机器学习》介绍Spark的基础知识,从利用Spark API来载入和处理数据,到将数据作为多种机器学习模型的输入。此外还通过详细的例子和现实应用讲解了常见的机器学习模型,包括推荐系统、分类、回归、聚类和降维。最后还介绍了一些高阶内容,如大规模文本数据的处理,以及Spark Streaming下的在线机器学习和模型评估方法。
6、实战4: Mahout ML【Mahout in Action】
作者:Sean Owen,Robin Anil等
译者:王斌 韩冀中 万吉
页数:340
Apache基金会官方推荐
Mahout核心团队权威力作
大数据时代机器学习的实战经典
《Mahout实战》Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout可以在自己的项目中应用亚马逊、Netflix等公司的机器学习技术。
7、实战5:Test-Driven实践【Thoughtful Machine Learning: A Test-Driven Approach】
作者:Matthew Kirk
译者:段菲
页数:204
用测试驱动方法开发出可靠、稳定的机器学习算法
利用机器学习技术解决涉及数据的现实问题
通过阅读本书,你将能够:
在编写代码之前,运用测试驱动的方法来编写和运行测试
学习八种机器学习算法的最佳用法,并进行权衡
通过动手实践真实示例,对每种算法进行测试
理解测试驱动开发和对解进行验证的科学方法之间的相似性
获悉机器学习的风险,如对数据产生欠拟合或过拟合
探索可改善机器学习模型或数据提取的各种技术
《机器学习实践:测试驱动的开发方法》每一章都通过示例介绍了机器学习技术能够解决的有关数据的具体问题,以及求解问题和处理数据的方法。具体涵盖了测试驱动的机器学习、机器学习概述、K 近邻分类、朴素贝叶斯分类、隐马尔可夫模型、支持向量机、神经网络、聚类、核岭回归、模型改进与数据提取等内容。