词共现网络的遗传聚类在话题发现中的应用
中国知网
广西大学
摘要
基于词聚类的话题发现方法中,普遍存在聚类结果不稳定(聚类结果较大程度依赖于聚类对象的初始化操作)的问题,为此通过将文档集建模为词共现网络,设计词共现网络的过滤方法,然后提出基于词共现网络的遗传聚类算法,实现从网络文档中提取热点话题。与已有方法相比,该方法所发现的话题相对稳定,这在实验中亦得到了验证,因而该方法在实际应用中具有更好的现实意义。
关键词
话题发现 词共现网络 遗传聚类算法 词聚类算法 topic detection word co-occurrence network Genetic Clustering Algorithm(GCA) word clustering algorithm
