[发明专利]一种图像中目标文本智能识别方法及系统有效

专利信息
申请号: 202110417894.4 申请日: 2021-04-19
公开(公告)号: CN112990220B 公开(公告)日: 2022-08-05
发明(设计)人: 段东圣;王海洋;佟玲玲;时磊;井雅琪;段运强;任博雅;李真;张旋;宋吉锋;王丽萍 申请(专利权)人: 烟台中科网络技术研究所;国家计算机网络与信息安全管理中心
主分类号: G06V30/148 分类号: G06V30/148;G06V30/19;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 烟台上禾知识产权代理事务所(普通合伙) 37234 代理人: 张亚平
地址: 264003 *** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 目标 文本 智能 识别 方法 系统
【权利要求书】:

1.一种图像中目标文本智能识别方法,其特征在于,包括如下步骤:

S1.获取目标文本的图像,将目标文本由像素点坐标表示,构建像素坐标识别神经网络,通过输入目标文本中所有文字的像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;

像素坐标识别神经网络训练过程包括编码过程和解码过程,编码部分包括输入层、映射层、逻辑层;解码部分包括反卷积层、卷积层、输出层;

编码过程:根据目标文本中的文字数量R确定输入数据集的维度,输入数据为目标文本所有文字的像素点坐标;每个汉字设定像素点坐标范围为(0,K)×(0,H),每一个连续小区域的坐标值作为输入的矩阵的一行,所有R个汉字排列在一起组成一个矩阵,将像素点坐标以矩阵的形式输入到神经网络:

输入层将降噪处理后的数据OutP1发送给映射层,映射层将输入的像素点坐标InP2=ω1,2OutP1映射到逻辑空间,ω1,2为输入层到映射层的连接权值,映射层将映射后的数据发送给逻辑层,逻辑层通过逻辑门组合出能够激活神经元的部分区间,提取文字特征,并将激活的部分进行融合,对其解码得到重构图像;

解码过程:使用单层反卷积神经网络进行上采样,使用包含2个卷积层的卷积网络,得到输出结果,建模卷积特征通道之间的相互依赖性自适应地不断优化权重参数来提高网络的表示能力,有效抑制无效特征,提升有效特征的权重,便于从图像中准确提取出目标文本;

S2.将待处理图像进行区域划分,得到不同像素值的区域,根据区域的高度值计算可以作为背景区域的区域数量,提取覆盖所述背景区域,剩余区域为前景区域;

根据图像中的像素值信息对图像进行区域划分,得到不同像素值的区域;统计每个区域中连续像素点纵向数量最大值作为每个区域的高度值,记为Mhi,i表示第i个区域,根据每个区域的高度值对区域进行排序,计算可以作为背景区域的区域数量:

Noba2=N(Mhi<εmin)st.3:Mhmin<εmin

其中,Noba表示背景区域数量,Noba1和Noba2分别是不同条件下对应的背景区域数量,Mhmax表示所有区域高度值中的最大值,Mhmin表示所有区域高度值中的最小值,εmax和εmin分别表示图像中文本所在区域的高度上阈值和下阈值,N(Mhi>εmax)表示图像中区域高度值大于文本所在区域的高度上阈值的区域的数量,N(Mhi<εmin)表示图像中区域高度值小于文本所在区域的高度下阈值的区域的数量,st.1、st.2、st.3分别表示三个条件;

S3.利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将上述待识别的文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本;

以任意一个小区域为开始,选取R个连续小区域的坐标值,每一行结束后从下一行最左侧开始继续选取,每一个连续小区域的坐标值作为输入的矩阵的一行,R为目标文本中文字的数量;文本自编码模型神经网络的输入为:

其中,任意一个小区域u的坐标输入为文本自编码模型的前半部分编码部分输出R个连续小区域坐标值的表述特征Tu,期望值为目标文本的表述特征T=OutP3,基于期望值获得小区域中的内容为目标文本的匹配值:

其中,MvD表示小区域中对应的目标文本匹配值,λ表示匹配因子,Sf(1)表示第1个神经元的开关,设定第一个小区域的匹配度高于其余R-1个小区域,τ表示判断因子;若匹配值MvD达到预设阈值,则识别出该小区域为目标文本,对该区域进行自动标注。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台中科网络技术研究所;国家计算机网络与信息安全管理中心,未经烟台中科网络技术研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110417894.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top