最新的论文在Expert Systems with Applications 2015 42卷13期上发表。
这篇论文采用等价类提升的策略,极大地提升了挖掘的速度,并且节省了内存消耗。所形成的PrePost+算法在时间和空间的性能度要明显优于PrePost和FIN算法。
PrePost+算法的下载地址为:http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/prepost+.cpp
相关论文的下载地址:
?http://www.sciencedirect.com/science/article/pii/S0957417415001803
由于节点列表的表示方法从底层极大减少了计算项集支持度的时间,所以PrePost+、PrePost和FIN可以扩张挖掘Rare Itemsets, Closed Itemsets, Maximal Itemsets, Frequent Generator Itemsets, Frequent Itemsets from Data Stream, Frequent Itemsets from Uncertain Data等。
另外,这三个算法也特别适合修改成并行的频繁模式挖掘算法(如基于GPU,Hadoop等并行计算平台)。有兴趣的同行可以开展上述工作的研究。基于节点列表的项集表示框架的频繁项集挖掘最新进展
原文:http://blog.csdn.net/pku_sigma/article/details/45155441