摘要
通过对关联规则挖掘基本问题的分析,总结经典挖掘算法Apriori的3点不足,针对不足进行相应改进:1)改变数据库映射方法,避免反复扫描数据库;2)确定非频繁项集,并确保其不与其它项连接,避免产生大量候选项;3)采用交运算,解决候选项集与事物模式匹配阶段耗时过多的问题.此外,为了验证改进算法的有效性,采用水文历史数据进行实验验证.实验结果表明,在支持度与置信度取不同值时,本文提出的改进算法IM-Apriori算法执行时间更短,效率更高.
-
单位河海大学