ScholarMate
客服热线:400-1616-289

LDA算法在Mahout下的高效实现(英文)

许伯熹; 胡宁; 陈文斌; 高卫国; 程晋
中国知网
复旦大学

摘要

通过对运用Gibbs采样的Latent Dirichlet Allocation(LDA)算法和MapReduce计算框架的细致研究,实现了LDA算法在Mahout下的分布式并行计算.详细地考察了该分布式并行计算程序的计算性能,并深入地探讨了一些影响计算性能的关键问题.

关键词

Latent Dirichlet Allocation Gibbs采样 Mahout 分布式并行计算 MapReduce计算框架 Latent Dirichlet Allocation Gibbs sampling Mahout distributed parallel computing MapReduce framework