好书推荐:《机器学习实战》&中英文高清PDF+源码免费下载

《机器学习实战》中英文高清PDF+源码免费下载

下载地址1:网盘下载

下载地址2:百度云链接:https://pan.baidu.com/s/1SNX0JP2LLNVqw2cjwLznsA       

                 提取码:t052 

封皮


目录

第一部分 分类 

第1章 机器学习基础 

1.1  何谓机器学习 

1.1.1  传感器和海量数据 

1.1.2  机器学习非常重要 

1.2  关键术语 

1.3  机器学习的主要任务 

1.4  如何选择合适的算法 

1.5  开发机器学习应用程序的步骤 

1.6  Python语言的优势 

1.6.1  可执行伪代码 

1.6.2  Python比较流行 

1.6.3  Python语言的特色 

1.6.4  Python语言的缺点 

1.7  NumPy函数库基础 

1.8  本章小结 

第2章 k-近邻算法 

2.1  k-近邻算法概述 

2.1.1  准备:使用Python导入数据 

2.1.2  从文本文件中解析数据 

2.1.3  如何测试分类器 

2.2  示例:使用k-近邻算法改进约会网站的配对效果 

2.2.1  准备数据:从文本文件中解析数据 

2.2.2  分析数据:使用Matplotlib创建散点图 

2.2.3  准备数据:归一化数值 

2.2.4  测试算法:作为完整程序验证分类器 

2.2.5  使用算法:构建完整可用系统 

2.3  示例:手写识别系统 

2.3.1  准备数据:将图像转换为测试向量 

2.3.2  测试算法:使用k-近邻算法识别手写数字 

2.4  本章小结 

第3章 决策树 

3.1  决策树的构造 

3.1.1  信息增益 

3.1.2  划分数据集 

3.1.3  递归构建决策树 

3.2  在Python中使用Matplotlib注解绘制树形图 

3.2.1  Matplotlib注解 

3.2.2  构造注解树 

3.3  测试和存储分类器 

3.3.1  测试算法:使用决策树执行分类 

3.3.2  使用算法:决策树的存储 

3.4  示例:使用决策树预测隐形眼镜类型 

3.5  本章小结 

第4章 基于概率论的分类方法:朴素贝叶斯 

4.1  基于贝叶斯决策理论的分类方法 

4.2  条件概率 

4.3  使用条件概率来分类 

4.4  使用朴素贝叶斯进行文档分类 

4.5  使用Python进行文本分类 

4.5.1  准备数据:从文本中构建词向量 

4.5.2  训练算法:从词向量计算概率 

4.5.3  测试算法:根据现实情况修改分类器 

4.5.4  准备数据:文档词袋模型 

4.6  示例:使用朴素贝叶斯过滤垃圾邮件 

4.6.1  准备数据:切分文本 

4.6.2  测试算法:使用朴素贝叶斯进行交叉验证 

4.7  示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向 

4.7.1  收集数据:导入RSS源 

4.7.2  分析数据:显示地域相关的用词 

4.8  本章小结 

第5章 Logistic回归 

5.1  基于Logistic回归和Sigmoid函数的分类 

5.2  基于最优化方法的最佳回归系数确定 

5.2.1  梯度上升法 

5.2.2  训练算法:使用梯度上升找到最佳参数 

5.2.3  分析数据:画出决策边界 

5.2.4  训练算法:随机梯度上升 

5.3  示例:从疝气病症预测病马的死亡率 

5.3.1  准备数据:处理数据中的缺失值 

5.3.2  测试算法:用Logistic回归进行分类 

5.4  本章小结 

第6章 支持向量机 

6.1  基于最大间隔分隔数据 

6.2  寻找最大间隔 

6.2.1  分类器求解的优化问题 

6.2.2  SVM应用的一般框架 

6.3  SMO高效优化算法 

6.3.1  Platt的SMO算法 

6.3.2  应用简化版SMO算法处理小规模数据集 

6.4  利用完整Platt SMO算法加速优化 

6.5  在复杂数据上应用核函数 

6.5.1  利用核函数将数据映射到高维空间 

6.5.2  径向基核函数 

6.5.3  在测试中使用核函数 

6.6  示例:手写识别问题回顾 

6.7  本章小结 

第7章 利用AdaBoost元算法提高分类 

性能 

7.1  基于数据集多重抽样的分类器 

7.1.1  bagging:基于数据随机重抽样的分类器构建方法 

7.1.2  boosting 

7.2  训练算法:基于错误提升分类器的性能 

7.3  基于单层决策树构建弱分类器 

7.4  完整AdaBoost算法的实现 

7.5  测试算法:基于AdaBoost的分类 

7.6  示例:在一个难数据集上应用AdaBoost 

7.7  非均衡分类问题 

7.7.1  其他分类性能度量指标:正确率、召回率及ROC曲线 

7.7.2  基于代价函数的分类器决策控制 

7.7.3  处理非均衡问题的数据抽样方法 

7.8  本章小结 

第二部分 利用回归预测数值型数据 

第8章 预测数值型数据:回归 

8.1  用线性回归找到最佳拟合直线 

8.2  局部加权线性回归 

8.3  示例:预测鲍鱼的年龄 

8.4  缩减系数来“理解”数据 

8.4.1  岭回归 

8.4.2  lasso 

8.4.3  前向逐步回归 

8.5  权衡偏差与方差 

8.6  示例:预测乐高玩具套装的价格 

8.6.1  收集数据:使用Google购物的API 

8.6.2  训练算法:建立模型 

8.7  本章小结 

第9章 树回归 

9.1  复杂数据的局部性建模 

9.2  连续和离散型特征的树的构建 

9.3  将CART算法用于回归 

9.3.1  构建树 

9.3.2  运行代码 

9.4  树剪枝 

9.4.1  预剪枝 

9.4.2  后剪枝 

9.5  模型树 

9.6  示例:树回归与标准回归的比较 

9.7  使用Python的Tkinter库创建GUI 

9.7.1  用Tkinter创建GUI 

9.7.2  集成Matplotlib和Tkinter 

9.8  本章小结 

第三部分 无监督学习 

第10章 利用K-均值聚类算法对未标注数据分组 

10.1  K-均值聚类算法 

10.2  使用后处理来提高聚类性能 

10.3  二分K-均值算法 

10.4  示例:对地图上的点进行聚类 

10.4.1  Yahoo! PlaceFinder API 

10.4.2  对地理坐标进行聚类 

10.5  本章小结 

第11章 使用Apriori算法进行关联分析 

11.1  关联分析 

11.2  Apriori原理 

11.3  使用Apriori算法来发现频繁集 

11.3.1  生成候选项集 

11.3.2  组织完整的Apriori算法 

11.4  从频繁项集中挖掘关联规则 

11.5  示例:发现国会投票中的模式 

11.5.1  收集数据:构建美国国会投票记录的事务数据集 

11.5.2  测试算法:基于美国国会投票记录挖掘关联规则 

11.6  示例:发现毒蘑菇的相似特征 

11.7  本章小结 

第12章 使用FP-growth算法来高效发现频繁项集 

12.1  FP树:用于编码数据集的有效方式 

12.2  构建FP树 

12.2.1  创建FP树的数据结构 

12.2.2  构建FP树 

12.3  从一棵FP树中挖掘频繁项集 

12.3.1  抽取条件模式基 

12.3.2  创建条件FP树 

12.4  示例:在Twitter源中发现一些共现词 

12.5  示例:从新闻网站点击流中挖掘 

12.6  本章小结 

第四部分 其他工具 

第13章 利用PCA来简化数据 

13.1  降维技术 

13.2  PCA 

13.2.1  移动坐标轴 

13.2.2  在NumPy中实现PCA 

13.3  示例:利用PCA对半导体制造数据降维 

13.4  本章小结 

第14章 利用SVD简化数据 

14.1  SVD的应用 

14.1.1  隐性语义索引 

14.1.2  推荐系统 

14.2  矩阵分解 

14.3  利用Python实现SVD 

14.4  基于协同过滤的推荐引擎 

14.4.1  相似度计算 

14.4.2  基于物品的相似度还是基于用户的相似度? 

14.4.3  推荐引擎的评价 

14.5  示例:餐馆菜肴推荐引擎 

14.5.1  推荐未尝过的菜肴 

14.5.2  利用SVD提高推荐的效果 

14.5.3  构建推荐引擎面临的挑战 

14.6  基于SVD的图像压缩 

14.7  本章小结 

第15章 大数据与MapReduce 

15.1  MapReduce:分布式计算的框架 

15.2  Hadoop流 

15.2.1  分布式计算均值和方差的mapper 

15.2.2  分布式计算均值和方差的reducer 

15.3  在Amazon网络服务上运行Hadoop程序 

15.3.1  AWS上的可用服务 

15.3.2  开启Amazon网络服务之旅 

15.3.3  在EMR上运行Hadoop作业 

15.4  MapReduce上的机器学习 

15.5  在Python中使用mrjob来自动化MapReduce 

15.5.1  mrjob与EMR的无缝集成 

15.5.2  mrjob的一个MapReduce脚本剖析 

15.6  示例:分布式SVM的Pegasos算法 

15.6.1  Pegasos算法 

15.6.2  训练算法:用mrjob实现MapReduce版本的SVM 

15.7  你真的需要MapReduce吗? 

15.8  本章小结 

附录A  Python入门 

附录B  线性代数 

附录C  概率论复习 

附录D  资源 

索引 

版权声明

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352

推荐阅读更多精彩内容