首页 > 其他 > 详细

关联规则分析-apriori

时间:2019-12-31 19:58:01      阅读:113      评论:0      收藏:0      [点我收藏+]

í一、概念

1、支持度support:数据集中A、B同时出现的频率,即 P(AB) = Freq(AB) / N

2、置信度confidence:在A出现的条件下,B出现的频率,即 置信度P(A->B) = Freq(AB) / Freq(A) 

3、提升度lift:left = 支持度(AB) / 支持度(A) * 支持度(B)

      注:提升度反应了关联规则中的A与B的相关性,提升都>1 且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。

例如:A和B的关联规则的支持度是0.2,A出现的支持度是0.3,B出现的支持度是0.5,则提升度是 1.33>1,表明 ”A -> B“ 规则对于B的出现有提升效果

4、频繁项集:满足最小支持度要求的项集。

5、关联规则:表示两个物品之间,存在很强的关系

6、性质:

    a、如果某个项集是频繁的,那么它的所有子集也是频繁的

    b、如果某个项集是非频繁的,那么它的所有超集也是非频繁的

    c、Apriori算法从单元素项集开始,通过满足最小支持度的项集来形成更大的集合

关联规则分析-apriori

原文:https://www.cnblogs.com/stacey999999/p/12073603.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!