ScholarMate
客服热线:400-1616-289

基于统一计算设备架构和基因表达式编程的自动聚类算法

杜欣; 刘大刚; 张开活; 申远; 赵康; 倪友聪
中国知网
福建师范大学

摘要

针对基于基因表达式编程(GEP)的自动聚类算法GEP-Cluster中聚类中心的筛选和聚合、计算数据对象到各聚类中心距离两个关键步骤效率不高的问题,提出了一种基于统一计算设备架构(CUDA)和GEP的自动聚类改进算法(CGEP-Cluster)。CGEP-Cluster算法采用基因阅读运算器方法对GEP-Cluster算法的聚类中心筛选和聚合步骤进行改进,并基于CUDA将GEP-Cluster算法中数据对象到各聚类中心距离的计算并行化。实验结果表明,在数据对象规模较大时,CGEP-Cluster算法可获得8倍左右的加速比。CGEP-Cluster算法可用于聚类数未知且数据对象规模较大情况下的自动聚类。

关键词

统一计算设备架构 基因表达式编程 聚类算法 GEP-Cluster 演化算法 Compute Unified Device Architecture(CUDA) Gene Expression Programming(GEP) clustering algorithm GEP-cluster evolutionary algorithm