[发明专利]一种图像中目标文本智能识别方法及系统有效
申请号: | 202110417894.4 | 申请日: | 2021-04-19 |
公开(公告)号: | CN112990220B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 段东圣;王海洋;佟玲玲;时磊;井雅琪;段运强;任博雅;李真;张旋;宋吉锋;王丽萍 | 申请(专利权)人: | 烟台中科网络技术研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 烟台上禾知识产权代理事务所(普通合伙) 37234 | 代理人: | 张亚平 |
地址: | 264003 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 目标 文本 智能 识别 方法 系统 | ||
1.一种图像中目标文本智能识别方法,其特征在于,包括如下步骤:
S1.获取目标文本的图像,将目标文本由像素点坐标表示,构建像素坐标识别神经网络,通过输入目标文本中所有文字的像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;
像素坐标识别神经网络训练过程包括编码过程和解码过程,编码部分包括输入层、映射层、逻辑层;解码部分包括反卷积层、卷积层、输出层;
编码过程:根据目标文本中的文字数量R确定输入数据集的维度,输入数据为目标文本所有文字的像素点坐标;每个汉字设定像素点坐标范围为(0,K)×(0,H),每一个连续小区域的坐标值作为输入的矩阵的一行,所有R个汉字排列在一起组成一个矩阵,将像素点坐标以矩阵的形式输入到神经网络:
输入层将降噪处理后的数据OutP1发送给映射层,映射层将输入的像素点坐标InP2=ω1,2OutP1映射到逻辑空间,ω1,2为输入层到映射层的连接权值,映射层将映射后的数据发送给逻辑层,逻辑层通过逻辑门组合出能够激活神经元的部分区间,提取文字特征,并将激活的部分进行融合,对其解码得到重构图像;
解码过程:使用单层反卷积神经网络进行上采样,使用包含2个卷积层的卷积网络,得到输出结果,建模卷积特征通道之间的相互依赖性自适应地不断优化权重参数来提高网络的表示能力,有效抑制无效特征,提升有效特征的权重,便于从图像中准确提取出目标文本;
S2.将待处理图像进行区域划分,得到不同像素值的区域,根据区域的高度值计算可以作为背景区域的区域数量,提取覆盖所述背景区域,剩余区域为前景区域;
根据图像中的像素值信息对图像进行区域划分,得到不同像素值的区域;统计每个区域中连续像素点纵向数量最大值作为每个区域的高度值,记为Mhi,i表示第i个区域,根据每个区域的高度值对区域进行排序,计算可以作为背景区域的区域数量:
Noba2=N(Mhi<εmin)st.3:Mhmin<εmin
其中,Noba表示背景区域数量,Noba1和Noba2分别是不同条件下对应的背景区域数量,Mhmax表示所有区域高度值中的最大值,Mhmin表示所有区域高度值中的最小值,εmax和εmin分别表示图像中文本所在区域的高度上阈值和下阈值,N(Mhi>εmax)表示图像中区域高度值大于文本所在区域的高度上阈值的区域的数量,N(Mhi<εmin)表示图像中区域高度值小于文本所在区域的高度下阈值的区域的数量,st.1、st.2、st.3分别表示三个条件;
S3.利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将上述待识别的文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本;
以任意一个小区域为开始,选取R个连续小区域的坐标值,每一行结束后从下一行最左侧开始继续选取,每一个连续小区域的坐标值作为输入的矩阵的一行,R为目标文本中文字的数量;文本自编码模型神经网络的输入为:
其中,任意一个小区域u的坐标输入为文本自编码模型的前半部分编码部分输出R个连续小区域坐标值的表述特征Tu,期望值为目标文本的表述特征T=OutP3,基于期望值获得小区域中的内容为目标文本的匹配值:
其中,MvD表示小区域中对应的目标文本匹配值,λ表示匹配因子,Sf(1)表示第1个神经元的开关,设定第一个小区域的匹配度高于其余R-1个小区域,τ表示判断因子;若匹配值MvD达到预设阈值,则识别出该小区域为目标文本,对该区域进行自动标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台中科网络技术研究所;国家计算机网络与信息安全管理中心,未经烟台中科网络技术研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110417894.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乘用车地毯水切割治具
- 下一篇:一种新能源汽车用连接件
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序