一种用于查询扩展词选取的主题模型
中国知网
东北大学
摘要
为能在搜索引擎返回的结果集上构建贴近用户意图的主题层,并在文档词与主题间建立映射,将社会化标注引入经典的LDA模型,构建一种基于主题-标签-文档词之间关系的三层主题模型,并将其用于伪相关反馈查询扩展词的选取.实验结果表明,该模型提取的查询扩展词能描述标签的语义,模型用于伪相关反馈后,提取的扩展词能覆盖查询条件,在多数情况下结果列表的NDCG值高于基本伪相关反馈和结果集聚类方法.
关键词
主题模型 伪相关反馈 查询扩展 扩展词选取 社会化标注 topic model pseudo feedback query expansion word extraction social annotation
