原文标题:Another 10 Free Must-Read Books for Machine Learning and Data Science
作者:Matthew Mayo, KDnuggets
注:
这是第三个系列的10本免费的机器学习和数据科学书籍。看一下有没有你感兴趣的内容,也可以翻阅一下前几期的阅读资料(https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html )。
考虑到“免费必读书目”系列前几期的受欢迎程度,第三期高质量(免费!)图书似乎是个不错的主意。本文你将获得一些入门的机器学习书籍,一些有趣的通用机器学习专题的书籍,比如特征工程和模型可解释性、深度学习简介、关于Python编程的书、两本数据可视化导入的书,以及两本有关强化学习的成果。
1.《机器学习中的数学》(Mathematics for Machine Learning ,Marc Peter Deisenroth, A. Aldo Faisal, and Cheng Soon Ong.链接:https://mml-book.github.io/)
我们正在写一本关于机器学习的数学知识的书来鼓励人们学习数学概念。这本书并不打算涵盖先进的机器学习技术,因为已经有很多这样的书。相反,我们的目标是提供必要的数学技能来阅读那些其他书籍。
2.《百页机器学习书》 (The Hundred-Page Machine Learning Book,Andriy Burkov.链接:http://themlbook.com/wiki/doku.php)
在100页中包含所有你需要知道的关于机器学习的知识。监督和非监督学习,支持向量机,神经网络,集成方法,梯度下降,聚类分析和降维,自编码和转移学习,特征工程和超参数优化!数学,直观表示,图例,都在短短一百页内!
先读后买的原则意味着你可以免费下载这本书,阅读并与你的朋友和同事分享。如果你喜欢这本书的话,你才会需要买。
3. 《深入深度学习》 (Dive into Deep Learning,Aston Zhang, Zack C. Lipton, Mu Li, and Alex J. Smola.链接:http://d2l.ai/)
我们着手创建了一个资源:(1)可以免费给每个人;(2)提供足够的技术深度,为成为一个应用机器学习科学家的路径提供一个真正的起点;(3)包含可运行代码,向读者展示如何在实践中解决问题;(4)允许我们和更广泛的社区的快速更新;(5)辅以一个论坛互动讨论技术细节和回答问题。
4. 《特征工程与选择: 一种预测模型的实用方法》(Feature Engineering and Selection: A Practical Approach for Predictive Models,Max Kuhn and Kjell Johnson,链接: https://bookdown.org/max/FES/)
特征工程和选择的目标是为重新表示的预测器提供工具,将这些工具放在良好的预测建模框架的上下文中,并陈述我们在实践中使用这些工具的经验。最后,我们希望这些工具和我们的经验能够帮助你生成更好的模型。
与应用预测建模中一样,我们使用R语言作为本书的计算工具。
5. 《可解释的机器学习》 (Interpretable Machine Learning,Christoph Molnar,链接:https://christophm.github.io/interpretable-ml-book/)
所有的解释方法都得到了深入的解释和批判性的讨论。 他们如何在黑盒里工作? 他们的优点和缺点是什么? 他们的输出如何解释? 本书将使您能够选择并正确地应用最适合您机器学习项目的解释方法。
本书侧重于表格式的数据(也称为关系数据或结构化数据)的机器学习模型,较少涉及计算机视觉和自然语言处理任务。 建议机器学习从业者,数据科学家,统计学家以及任何有兴趣使机器学习模型可解释的人阅读本书。
6.《简明Python教程》 (A Byte of Python,Swaroop C. H..链接:https://python.swaroopch.com/)
《简明Python教程》是一本关于使用Python语言编程的免费书籍。 它可以作为初学者的Python语言教程或指南。 如果你对计算机的了解只是如何保存文本文件这种程度,那么这本书就是为你准备的。
7.《用于R图形的BBC的视觉和数据新闻手册》(BBC Visual and Data Journalism cookbook for R graphics,BBC.链接:https://bbc.github.io/rcookbook/)
作为BBC的数据团队,我们使用R的ggplot2库开发了一个R包和一个R手册,以我们的内部风格,制作了可重复的创建待出版的图表的过程,并使新接触R的人更容易创建图表。
手册应该可以帮助任何想制作图表的人。
8. 《数据可视化:实用介绍》 (Data Visualization: A practical introduction,Kieran Healy.链接:https://socviz.co/index.html )
你应该观察你的数据。 通过图形和图表能够浏览和了解你所收集信息的结构。 良好的数据可视化还可以更轻松地将你的想法和发现传达给其他人。 除此之外,从你自己的数据中生成有效的图表是培养阅读和理解图表的良好视角的最佳方式——无论是在研究类文章,商业幻灯片,公共政策倡议书还是媒体报道中呈现的图表。这本书会教你如何做到这一点。
9.《强化学习算法》(Algorithms for Reinforcement Learning,Csaba Szepesvári.链接:https://sites.ualberta.ca/~szepesva/RLBook.html)
强化学习的目标是开发有效的学习算法,并且理解算法的优点和局限性。 强化学习引起了人们极大的兴趣,因为它可以用来解决从人工智能问题到运筹学或控制工程的大量实际应用。 在本书中,我们聚焦于强化学习中的那些建立在强大的动态规划理论基础之上的算法。 我们给出了一个相当全面的学习问题目录,描述了核心思想,记录了大量最先进的算法,然后讨论了它们的理论性质和局限性。
10.《强化学习与最优控制》(Reinforcement Learning and Optimal Control,Dimitri P. Bertsekas.链接:http://web.mit.edu/dimitrib/www/RLbook.html)
本书的目的是解决大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以解决的。我们讨论了依赖于近似来获得具有足够性能的次优策略的解决方法。这些方法统称为强化学习,也有其他名称,如近似动态规划和神经动态规划。
相关阅读: