关联规则概念理解

支持度:商品组合A、B出现的频数,记为S。

支持度很高的时候,代表商品A和B经常同时被购买,但不能说明A对B的影响。反例:所有订单都买了A,那么A与其他所有产品的支持度都很高。

置信度:购买商品A后,购买商品B的概率,即条件概率,记为P。

置信度很高的时候,代表B经常在A被买之后接着被购买。但没有考虑B本身的频率,也不能说明A对B的影响。反例:只有一个订单买了B,那么所有前序商品对B的置信度都很高。

提升度:购买商品A后购买B的概率与所有购买B的概率的比例,即P(A|B)/S(B),记为L。可以说明购买A之后,对购买商品B的提升程度。

例子:现有眼霜A与面膜B,买眼霜的人比买面膜的人多,S(眼霜)=10%,S(面膜)=5%,同时买眼霜和面膜的人很少,S(眼霜+面膜)=1%。由此可以算出:

P(眼霜|面膜) = S(眼霜+面膜) ÷ S(眼霜) = 10%

即10%的人会买眼霜,这10%中只有10%的人会继续买面膜。这个数字并不高,看起来似乎不能说明什么。但是,所有人中只有5%的人会买面膜,而买了眼霜的人群,就有10%的人会买面膜了!即:

L(眼霜→面膜) =  P(眼霜|面膜) ÷ S(面膜) = 2

也就是说,如果想要促使人们买面膜,让他们先购买眼霜再购买面膜比直接让他们购买面膜要容易一倍。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容