关联规则优化--FP-growth

1、FP-growth的由来？

由于apriori会产生大量候选集，并且多多次扫描数据库，需要很大的I/O（input/output）负载。

所以han等人在2000年提出了频繁模式增长（frequent pattern-growth）的算法。

2、好处？

它将提供的频繁项压缩到一个频繁模式树（frequent pattern tree）中，但仍保留原始信息，然后将压缩后的数据库划分成一组条件数据库，每个关联的频繁项或模式段，将分别挖掘每个条件数据库。

3、举例说明。

4、日常催促自己找案例进行算法实现，并且快点完成github的博客搭建思密达。

关联规则 优化--FP-growth