前不久,和几位AI/python和数据分析领域的大神请教
入行的初学者应该准备哪几本书?
他们强烈推荐这11本神书
01《机器学习的数学》宾大
1962页
个人推荐指数:★★★★
此书来自宾夕法尼亚大学计算机与信息科学系,涵盖代数,拓扑,微积分和优化理论,提供免费PDF下载(链接见文末)。打开细看,一股丰盛的数学大餐的气息迎面扑来:内置9大章节,1962页全面丰富的计算机科学和机器学习相关数学知识,有教学,还有习题。
02《深度学习》
731页
个人推荐指数:★★★★★
《深度学习》又名:花书,由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的经典教材。
全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是深度学习未来的研究重点。
03《自然语言处理综论》
613页
个人推荐指数:★★★★★
本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。
04《统计学习方法》-李航
229页
个人推荐指数:★ ★ ★ ★ ★
想学数据挖掘或者机器学习不可避免要接触数学相关理论,尽管你可以只用sklearn等做机器学习,但不懂底层理论,是无法做深入的,而这本书,就是给你打好机器学习基础的书,先修内容大学数学三件套(高等数学、线性代数、概率论与数理统计),如果你不是数学基础特别好,看这本书的时候会像我一样看不懂一些公式推导,莫慌,百度一下别人的学习笔记或者技术博客,慢慢钻研,本书适合看多次,每次都有新的收获,书本身不厚,230页,建议边看边将感悟推导公司等写在旁边,方便下次看。
05 《模式识别与机器学习》
749页
个人推荐指数:★ ★ ★ ★
微软剑桥研究院实验室主任 Christopher Bishop 的经典著作《Pattern Recognition and Machine Learning》,中文译名《模式识别与机器学习》,简称 PRML,此书涵盖面十分广泛,语言通俗,例子和习题更加详细,附带更多基础性的讲解和指引,难度梯度设置更为合理,是其深受广大中老年 PHD 朋友喜爱的原因。《模式识别与机器学习》内容十分丰富,共有 14 章的内容,每一章都是干货满满。
毫无疑问,PRML实乃入门必读之圣书!豆瓣评分高达9.5分。
06《神经网络与深度学习》
229页
个人推荐指数:★ ★ ★
一本由美国量⼦物理学家、科学作家 Michael Nielsen编写的非常好的深度学习入门书籍-《Neural Network and Deep Learning》,中文译为《神经网络与深度学习》。这是一本解释人工神经网络和深度学习背后核心思想的免费在线书籍。
07《Machine Learning Yearning》
112页
个人推荐指数:★ ★ ★★
NG本人说:“AI,机器学习和深度学习正在逐渐改变越来越多的行业。我写这本书《Machine Learning Yearning》的目的就是教会大家如何构建自己的机器学习项目。这本书的目的不是教你机器学习算法理论,而是教你如何使用这些算法。一些技术AI课程会给你锤子工具,而这本书就是让你学会如何使用这些锤子工具。如果你致力于成为AI技术领导者并渴望为你的团队找到正确的方向。”
这本书《Machine Learning Yearning》能够从以下几个方面给你带来收获:
优先考虑AI项目最有前途的方向。
调试机器学习项目中的错误。
在复杂设置中构建ML,例如训练/测试样本不匹配。
构建一个ML项目,接近甚至达到人类水平。
知道什么时候、如何使用端对端学习、迁移学习和多任务学习。
08《动手学深度学习》
549页
个人推荐指数:★ ★ ★ ★
特别介绍一下,李沐大神的《动手学深度学习》,此书被国内的人民邮电出版社发行了纸质版,深受大批学习者的关注和喜爱。更为良心的是:作者保留了电子书版权,并在近期开源了最新的《动手学深度学习》。
内容简介
此书的结构:
以下是主要目录:
09《利用Python进行数据分析》
个人推荐指数:★ ★ ★ ★★
本书内容包含目录
前言
第1 章 准备工作
第2章 Python语言基础、IPython及Jupyter notebook第
第3 章 内建数据结构、函数及文件第
第4章 NumPy 基础∶数组与向量化计算第
第5 章 pandas 入门
第6章 数据载入、存储及文件格式第
第7章 数据清洗与准备
第8章 数据规整∶连接、联合与重塑第
第9 章 绘图与可视化第
第10 章 数据聚合与分组操作第
第11章 时间序列第
第12章 高阶 pandas第
第13章 Python建模库介绍第
第14 章 数据分析示例附录A 高阶 NumPy
附录B 更多IPython系统相关内容
本书第 1 版出版于 2012 年,彼时基于 Python 的开源数据分析库(例如 pandas)仍然是一个发展迅速的新事物。在本次更新、拓展的第 2版中,作者在一些章节内进行了修改,以解释过去 5 年中发生的不兼容的变更、弃用和一些新特性。此外,我还添加了新内容,用以介绍在 2012 年还不存在或者不成熟的工具。最后,我会避免把一些新兴的或者不太可能走向成熟的开源项目写入本书。我希望本版的读者能够发现本书内容在2020 年或者 2021 年仍然几乎像在 2017 年一样好用。
10《Tableau数据可视化》
个人推荐指数:★ ★ ★ ★★
本书由专业数据分析师根据新版Tableau 10精心编写- 详尽介绍Tableau的各项功能及其在数据可视化方面的应用技巧- 配合丰富案例讲解,特别提供两个热门商业案例分析,快速提高实战技能 邂逅 Tableau 10,数据依旧,魅力倍增——
本书的特色
(1)内容全面,讲解详细 本书详细介绍了Tableau大部分常用功能,对于初次学习Tableau软 件的读者来说帮助较大。书中列出了创建可视化数据分析视图的每一步 操作,便于读者的实践练习。
(2)由浅入深、循序渐进 本书从Tableau简介、连接数据源、基础操作、高级操作到Tableau Online和Tableau Server等,由浅入深,循序渐进,适合各个层次的读者 阅读。
(3)案例丰富,高效学习 本书在介绍功能的同时基本都是结合案例进行操作。同时,为了使 读者快速提高数据分析的整体能力,本书的最后两章列举了网上超市运 营案例分析和网站流量案例分析两个案例。
11《谁说菜鸟不会数据分析》
个人推荐指数:★ ★ ★ ★★★
本书的特色
这是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,完全按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、确定数据分析的结构化思维、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美以及专业分析报告的撰写等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。本书能有效帮助职场新人提升职场竞争力,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士,各级管理人士提高专业水平。