机器学习入门-关联分析与频繁样式勘探

关联分析

import pandas
movie = pandas.read_csv('Data/movies.csv')
movie_dic = {}
for i in movie.iterrows():
    movie_dic[i[1].movieId] =i[1].title
import datetime 
df = pandas.read_csv('Data/ratings.csv')
from apyori import apriori
transactions = [ele for ele in df.groupby('userId')['movieId'].apply(list)]
rules = apriori(transactions,min_support = 0.2,min_confidence = 0.5,min_lift = 3,min_length=2)
results = list(rules)
for rec in results:
    print(rec)
    print(';'.join([movie_dic[item] for item in rec.items]))

频繁样式勘探

from pymining import itemmining
fp_input = itemmining.get_fptree(transactions)
report=itemmining.fpgrowth(fp_input,min_support=30,pruning=True)
for ele in report:
    if len(ele)>=6:
        print(';'.join([movie_dic[item] for item in ele]))

最后编辑于：2017.12.08 22:53:43

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

【机器学习实战】第11章使用 Apriori 算法进行关联分析
第 11 章使用 Apriori 算法进行关联分析关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。...
Joyyx阅读 5,797评论 0赞 7
机器学习_规则与关联规则模型Apriori、FP-Growth
1. 何时使用规则模型机器学习时常遇到一个问题：当数据并不完全可分时，分类器得分不高。真实世界中的数据经常...
xieyan0811阅读 9,699评论 0赞 4

机器学习实战-使用Apriori算法进行关联分析
从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联学习。本章将主要介绍Apriori算法来解决问题。 Ap...
mov觉得高数好难阅读 4,693评论 0赞 0
【机器学习】无监督学习之关联规则学习
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。机器学习在学习方...
风雪同域阅读 11,783评论 0赞 7
ZeroMQ社区生态白皮书
ZeroMQ社区生态白皮书持续关注汇总社区最新动态：发起人、参考书目、Google检索、Github热度、相关技术...
RiboseYim阅读 6,060评论 0赞 8

赞1赞

赞赏

手机看全文