第九章 数据关联规则分析算法——基于Eclat算法的频繁项集挖掘

9.3 基于Eclat算法的频繁项集挖掘

Eclat算法是一种与FP-Growth算法,Apriori算法思路不尽相同的算法,它是利用倒排索引的思想,但并不是利用倒排索引进行快速查找,而是进行数据统计。

构建倒排索引后,由频繁N项集进行求集的操作,得到候选的N+1项集,再求候选的N+2项集,不断迭代该过程,直到项集归一。

利用倒排索引快速构建频繁项集是Eclat算法中的应用技巧,因为倒排表是一种适合于关系型计算的关系。Eclat算法把交易信息(事务)划分到每个项之下,使Eclat算法可以利用集合的简单运算即可得到的频繁项集。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容