ScholarMate
客服热线:400-1616-289

均匀分布下不确定数据的关联规则变粒度查询

陈爱东; 刘国华; 肖瑞; 万小妹; 石丹妮
中国知网
东华大学

摘要

云计算为大数据的关联规则挖掘与查询提供了平台。为防止隐私泄漏,大数据中往往包含人为添加的不确定因素,如何使用户对不确定数据的关联规则挖掘结果查询透明化是大数据挖掘结果查询亟待解决的问题。在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则挖掘结果集的变粒度查询提供便利。首先,通过UFIDM算法进行挖掘并构建关联规则库,为提高查询效率,对泛化标识符和敏感属性分别构建Hilbert packed R树索引。在此基础上,提出了泛化值粒度转换方法和U-ARS查询算法。最后,通过理论分析和实验比对,展示了算法的可行性和有效性。

关键词

大数据 均匀分布不确定数据 关联规则 变粒度查询 big data uniform distributed uncertain data association rules granularity transform query