一个合格的读者,应该明白自己需要什么(机器学习实战)书评
https://book.douban.com/review/6249619/
这本书能让你明白:
那些被吹捧得出神入化的分类算法,竟然实现起来如此简单;
那些看是高深的数学理论,其实一句话就能道明其本质;
一切复杂的事物,出发点都是非常简单的想法。
[list]《机器学习实战》学习笔记 - qwertWZ - 博客园 http://www.cnblogs.com/qwertWZ/p/4510859.html
使用Apriori算法和FP-growth算法进行关联分析 - qwertWZ - 博客园 http://www.cnblogs.com/qwertWZ/p/4510857.html
系列文章:《机器学习实战》学习笔记
最近看了《机器学习实战》中的第11章(使用Apriori算法进行关联分析)和第12章(使用FP-growth算法来高效发现频繁项集)。正如章节标题所示,这两章讲了无监督机器学习方法中的关联分析问题。关联分析可以用于回答"哪些商品经常被同时购买?"之类的问题。书中举了一些关联分析的例子:
通过查看哪些商品经常在一起购买,可以帮助商店了解用户的购买行为。这种从数据海洋中抽取的知识可以用于商品定价、市场促销、存活管理等环节。
在美国国会投票记录中发现关联规则。在一个国会投票记录的数据集中发现议案投票的相关性,(原文:这里只是出于娱乐的目的,不过也可以……)使用分析结果来为政治竞选活动服务,或者预测选举官员会如何投票。
发现毒蘑菇的相似特征。这里只对包含某个特定元素(有毒性)的项集感兴趣,从中寻找毒蘑菇中的一些公共特征,利用这些特征来避免吃到那些有毒蘑菇。
在Twitter源中发现一些共现词。对于给定搜索词,发现推文中频繁出现的单词集合。
从新闻网站点击流中挖掘新闻流行趋势,挖掘哪些新闻广泛被用户浏览到。
搜索引擎推荐,在用户输入查询词时推荐同相关的查询词项。
从大规模数据集中寻找物品间的隐含关系被称作关联分析(association analysis)或者关联规则学习(association rule learning)。这里的主要问题在于,寻找物品的不同组合是一项十分耗时的任务,所需的计算代价很高,蛮力搜索方法并不能解决这个问题,所以需要用更智能的方法在合理的时间范围内找到频繁项集。本文分别介绍如何使用Apriori算法和FP-growth算法来解决上述问题。
《机器学习实战》读书笔记11 - 简书
http://www.jianshu.com/p/d5c210186808