Prerequisite.
A对B的支持度,指的是事件A和事件B同时发生的概率,Support=P(AB).
置信度,指的是事件A已经发生了,再发生事件B的概率,就是概率论中的条件概率Confidence=P(B|A)=P(AB)/P(A)
如果事件A代表买牛奶,事件B代表买面包:
假设总共有33%的人买了牛奶 那么 P(A) = 0.33
假设总共有20%的人同时购买了牛奶和面包,那么Support(A->B) = 20%
Confidence(A->B)=P(B|A)=P(AB)/P(A) = 0.2/0.33 = 0.6
Confidence(A->B)=60% 就代表所有买牛奶的人中,60%的也购买了面包。
因此认为60%的可信度,买了牛奶的人会买面包。
如果事件A中包含K个元素,那么称这个事件A为K项集,比如同时买三样东西就是一个3项集,
TODO
Python 代码
TODO
参考:
1.http://www.tanglei.name/apriori-algorithm-in-python/
原文:http://www.cnblogs.com/jerrylu/p/4360775.html