ScholarMate
客服热线:400-1616-289

基于Attention-CTC的自然场景文本识别算法

和文杰; 刘敬彪; 潘勉; 吕帅帅
中国知网
杭州电子科技大学

摘要

针对自然场景下文本识别所存在的字符分割困难、识别精度依赖字典等问题,文中提出了一种基于注意力机制与连接时间分类损失相结合的文本识别算法。利用卷积神经网络与双向长短时期记忆网络实现对图像的特征编码,再使用Attention-CTC结构实现对特征序列的解码,有效解决Attention解码无约束的问题。该算法避免了对标签进行额外对齐预处理和后续语法处理,在加快训练收敛速度的同时显著提高了文本识别率。实验结果表明,该算法对字体模糊、背景复杂的文本图像都具有很好的鲁棒性。

关键词

文本识别 连接时间分类 卷积神经网络 循环神经网络 多尺度特征提取 注意力机制 text recognition connection time classification convolution neural network recurrent neural network multi-scale feature extraction attention mechanism