ScholarMate
客服热线:400-1616-289

基于双向LSTM和GBDT的中医文本关系抽取模型

罗计根; 杜建强; 聂斌; 熊旺平; 刘蕾; 贺佳
中国知网
江西中医学院

摘要

为解决采用softmax作为长短期记忆网络分类器导致实体关系识别模型泛化能力不足,不能较好适用中医实体关系抽取等问题,提出一种融合梯度提升树的双向长短期记忆网络的关系识别算法(BILSTM-GBDT)。先采用word2vec对中医文本进行向量化表示,再利用基于注意力机制的双向长短期记忆网络提取高阶特征,最后采用集成分类模型梯度提升树作为特征分类器,提高关系识别效果。在中医等多个关系语料库上的实验结果表明,该模型与传统SVM方法、GBDT方法及其深度学习方法相比,均有更高的精确率、召回率和F值。

关键词

关系抽取 长短期记忆网络 梯度提升树 注意力机制 中医文本 relationship extraction LSTM GBDT attention mechanism Chinese medicine text