一、《An Introduction to Statistical Learning》统计学导论
学习统计学可以从这本书入手《An Introduction to Statistical Learning》.
1、作者介绍
作者:加雷斯·詹姆斯(Gareth James)
James是南加州大学马歇尔商学院的教授,94年在奥克兰大学获得理学士学位和商业学士学位。98年获得博士学位。
进入其个人主页,首页上放的第一句话:
"Data is the sword of the 21st century, those who wield it well, the Samurai."
数据是21世纪的宝剑,使用得当的人可以变成武士。
2、书本适用对象
《An Introduction to Statistical Learning》这本书荣获Technometrics颁发的2014年Eric Ziegel奖。
随着互联网的发展,在各行业各领域的数据收集规模和范围的不断扩大,对于那些希望了解数据的人来说,统计学已成为至关重要的工具。《统计学习入门》对统计学习中的关键主题提供了广泛而较少的技术性处理。每章都包含一个R实验室。本书适合对象:希望使用现代工具进行数据分析的任何人。
3、书本下载地址
作者直接把他的第一个版本免费开放下载,
书本介绍及下载地址:An Introduction to Statistical Learning
二、《The elements of statistical learning》统计学习基础
这本书难度会有所上升,用到了大量的矩阵求导,且最好有一定的机器学习基础,不然,可能学起来会有点吃力。
1、作者:Hastie, Trevor, et al.
2、书里内容主要目录如下:
第一章:导言
第二章:监督学习的综述
第三章:回归的线性方法(新:LAR算法和lasso的一般化)
第四章:分类的线性方法(新:逻辑斯蒂回归的lasso轨迹)
第五章:基本的扩展和正则化(新:RKHS的补充说明)RKHS(再生核希尔伯特空间)
第六章:核光滑方法
第七章:模型评估与选择(新:交叉验证的长处与陷阱)
第八章:模型推论与平均
第九章:补充的模型、树以及相关的方法
第十章:Boosting和Additive Trees(新:生态学的新例子,一些材料分到了16章)
第十一章:神经网络(新:贝叶斯神经网络和2003年神经信息处理系统进展大会(NIPS)的挑战)
第十二章:支持向量机和灵活的判别式(新:SVM分类器的路径算法)
第十三章:原型方法和邻近算法
第十四章:非监督学习(新:谱聚类,核PCA,离散PCA,非负矩阵分解原型分析,非线性降维,谷歌pagerank算法,ICA的一个直接方法)
第十五章:随机森林
第十六章:实例学习
第十七章:无向图模型
第十八章:高维问题
知乎上有位答主“岳子涵”将这本书各章节主要内容都介绍了一下,对于啃起来毫无头絮的同学,可以参考。
The Elements of Statistical Learning 需要怎样的数学基础才能读懂?
3、下载地址
英文原版下载地址:
https://esl.hohoweiya.xyz/book/The%20Elements%20of%20Statistical%20Learning.pdf
中文版!中文版!查看地址:
https://esl.hohoweiya.xyz/index.html
4、对应的中文版教材《统计学习基础》--支持正版。