ScholarMate
客服热线:400-1616-289

基于GA与PSO混合优化的Web文档聚类算法

黄发良; 苏毅娟
中国知网
福建师范大学

摘要

Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20Newsgroups的实验,结果表明我们的方法具有良好的聚类有效性,能较完全和准确地将主题相关的Web文档聚成一类.

关键词

遗传算法 粒子群优化 混合优化 Web文档聚类 GA(Genetic Algorithm) PSO(Particle Swarm Optimization) hybrid optimization Web document clustering