[发明专利]曲形文本识别方法、装置、设备及介质在审
申请号: | 202110461569.8 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113033543A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 易苗;张蓉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06N3/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;杨毅玲 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 设备 介质 | ||
1.一种曲形文本识别方法,其特征在于,所述曲形文本识别方法包括:
响应于文本识别指令,根据所述文本识别指令获取待检测图像;
利用DBNet算法对所述待检测图像进行文本检测,得到至少一个文本区域的掩膜图像;
基于轮廓分析检测所述掩膜图像中的曲形文本及非曲形文本;
识别所述曲形文本中每个曲形文本的拟切分点;
基于区域划分调整每个曲形文本的拟切分点,得到每个曲形文本的目标切分点;
根据每个曲形文本的目标切分点切分对应的曲形文本,得到至少一个子文本;
组合所述至少一个子文本及所述非曲形文本,得到待识别文本;
利用配置网络对所述待识别文本进行文本识别,得到识别结果。
2.如权利要求1所述的曲形文本识别方法,其特征在于,所述根据所述文本识别指令获取待检测图像包括:
解析所述文本识别指令的方法体,得到所述文本识别指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述文本识别指令所携带的信息中进行遍历,并将遍历到的数据确定为目标地址;
连接至所述目标地址,并获取所述目标地址处存储的数据作为所述待检测图像。
3.如权利要求1所述的曲形文本识别方法,其特征在于,所述利用DBNet算法对所述待检测图像进行文本检测,得到至少一个文本区域的掩膜图像包括:
利用DBNet的主干网提取所述待检测图像的图像特征;
对所述图像特征进行上采样处理,得到与所述待检测图像具有相同尺寸的特征图;
基于DBNet算法,根据所述特征图进行预测,得到概率图及阈值图;
根据所述概率图及所述阈值图进行二值化处理,得到所述至少一个文本区域的掩膜图像。
4.如权利要求1所述的曲形文本识别方法,其特征在于,所述基于轮廓分析检测所述掩膜图像中的曲形文本及非曲形文本包括:
对于所述掩膜图像中的每个文本区域,根据预设间隔建立至少一个点组成每个文本区域的拟合点集;
获取每个拟合点集中的初始点及结束点;
连接每个拟合点集中的所述初始点及所述结束点,得到每个文本区域的基准线;
对于每个文本区域,计算对应拟合点集中的每个点到对应基准线的垂直距离;
当每个点到对应基准线的垂直距离都大于预设阈值时,确定对应的文本区域为所述曲形文本;或者
当每个点到对应基准线的垂直距离不都大于所述预设阈值时,确定对应的文本区域为所述非曲形文本。
5.如权利要求1所述的曲形文本识别方法,其特征在于,所述识别所述曲形文本中每个曲形文本的拟切分点包括:
对于每个曲形文本,按照由大到小的顺序对每个点到对应基准线的垂直距离进行排序;
获取排在首位的点作为每个曲形文本的拟切分点。
6.如权利要求1所述的曲形文本识别方法,其特征在于,所述基于区域划分调整每个曲形文本的拟切分点,得到每个曲形文本的目标切分点包括:
将每个拟切分点确定为中心,根据配置延伸范围进行区域划分,得到每个拟切分点对应的临近区域;
对每个临近区域进行二值化处理,得到每个临近区域的二值图像;
计算每个临近区域的二值图像的垂直投影;
根据每个临近区域的垂直投影确定每个曲形文本的目标切分点。
7.如权利要求1所述的曲形文本识别方法,其特征在于,所述利用配置网络对所述待识别文本进行文本识别,得到识别结果包括:
利用卷积神经网络对所述待识别文本进行特征提取,得到目标特征;
利用循环神经网络提取所述目标特征的时序特征;
将所述时序特征输入至序列识别层,并获取所述序列识别层的输出作为所述识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110461569.8/1.html,转载请声明来源钻瓜专利网。