LDA算法在Mahout下的高效实现(英文)
中国知网
复旦大学
摘要
通过对运用Gibbs采样的Latent Dirichlet Allocation(LDA)算法和MapReduce计算框架的细致研究,实现了LDA算法在Mahout下的分布式并行计算.详细地考察了该分布式并行计算程序的计算性能,并深入地探讨了一些影响计算性能的关键问题.
关键词
Latent Dirichlet Allocation Gibbs采样 Mahout 分布式并行计算 MapReduce计算框架 Latent Dirichlet Allocation Gibbs sampling Mahout distributed parallel computing MapReduce framework
