ScholarMate
客服热线:400-1616-289

基于角点类别特征和边缘幅值方向梯度直方图统计特征的复杂场景文字定位算法

姜维; 卢朝阳; 李静; 刘晓佩
中国知网
西安电子科技大学

摘要

针对复杂场景中纹理丰富的非文字区对文字定位算法的干扰,提出了基于光度不变量的角点类别特征和边缘幅值方向梯度直方图(Histogram of oriented gradients of edge magnitude,HOG-EM)统计特征两种新特征,并据此设计了一种两级多层复杂场景文字定位算法。首先获取边缘图像并提取根据HSL颜色空间特性划分的8层二值化图像,将其组成9层子图并做连通域分析提取文字候选区。然后提取文字候选区的角点类别特征和HOG-EM统计特征,将二者分别用于剔除非文字候选区和获取文字。实验表明:本文算法可以较为准确地剔除纹理丰富的非文字区,有效地降低复杂场景文字定位算法的虚警率,取得比较理想的准确率和召回率。

关键词

信息处理技术 文字定位 角点类别 方向梯度直方图 光度不变量 information processing technology text localization corner-type histogram of oriented gradients photometric invariants