基于论坛话题段落划分的答案识别
中国知网
-
摘要
在论坛话题中识别答案是面向论坛的问答对挖掘中的核心问题.在论坛话题的讨论中通常存在隐式的结构,这种结构信息非常有助于最佳答案的定位和识别.本文提出了一种基于中文论坛话题段落划分的答案识别方法:首先将论坛话题重新组织为若干段落的集合,并基于此划分提取一组能够反映话题讨论逻辑结构的特征.在此基础上给出了一种可以根据候选答案所在段落类别实现模型选择的答案识别策略,从而避免了噪声信息对模型预测的误导.实验结果表明本文的答案识别方法非常适用于面向在线论坛的问答资源挖掘工作.
关键词
话题段落划分 非文本特征 答案识别 在线论坛 问答对挖掘 Thread segmentation non-textual feature answer detection online forum question-answer(QA) pair mining
