[发明专利]图像识别方法、装置及电子设备有效
申请号: | 201810175904.6 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108537115B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 丁威 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/22;G06V10/50;G06N3/04;G06N3/08;G06V30/28 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 | ||
1.一种图像识别方法,用于识别输入图像中所具有的一个或多个目标,所述目标包括字符和空格,所述方法包括:
获取待识别的输入图像;
基于设定的N值或设定的子块尺寸,确定所述输入图像所包含的N个子块,提取所述子块对应的图像特征值,所述图像特征值描述所述子块所具有的像素信息,N≥1;其中,一个子块对应目标的部分内容;
将所述N个子块及对应的图像特征值作为输入,利用识别模型确定所述N个子块所对应的目标;其中,所述识别模型针对第i个子块,结合所述输入图像中排列在该第i个子块之前和之后的若干个子块的图像特征值,确定该第i个子块对应的目标;所述识别模型预先利用样本图像包含的目标、以及样本图像的多个子块的图像特征值而训练得到,1≤i≤N;
根据所述N个子块所对应的目标,基于所述识别模型确定出的空格,将相邻的若干个相同的字符合并为一个字符,确定所述输入图像中所包含的目标。
2.根据权利要求1所述的方法,所述确定所述输入图像所包含的N个子块,包括:
将所述输入图像平均划分为所述N个子块。
3.根据权利要求1所述的方法,所述提取所述子块对应的图像特征值,包括:
利用卷积神经网络模型提取所述图像特征值,所述卷积神经网络模型预先利用样本图像训练得到。
4.根据权利要求1所述的方法,所述识别模型包括至少一层双向循环神经网络,输入至所述双向循环神经网络的数据具有时间顺序,所述时间顺序为所述N个子块在所述输入图像中的排列顺序。
5.根据权利要求1所述的方法,所述目标包括字符或空格;
所述确定所述输入图像中所包含的目标,还包括:
删除所述空格后,确定所述输入图像中所包含的字符。
6.根据权利要求1所述的方法,所述样本图像通过如下方式获得:
获取包含有至少一个目标的真实图像,去除所述真实图像中的至少一个目标,在去除位置合成模拟目标后添加噪声,获得样本图像。
7.根据权利要求6所述的方法,所述模拟目标的生成方式,包括:
根据不同颜色、字体或字号,生成所述模拟目标。
8.一种图像识别装置,用于识别输入图像中所具有的一个或多个目标,所述目标包括字符和空格,所述装置包括:
图像获取模块,用于:获取待识别的输入图像;
特征提取模块,用于:基于设定的N值或设定的子块尺寸,确定所述输入图像所包含的N个子块,提取所述子块对应的图像特征值,所述图像特征值描述所述子块所具有的像素信息,N≥1;其中,一个子块对应目标的部分内容;
识别模块,用于:将所述N个子块及对应的图像特征值作为输入,利用识别模型确定所述N个子块所对应的目标;其中,所述识别模型针对第i个子块,结合所述输入图像中排列在该第i个子块之前和之后的若干个子块的图像特征值,确定该第i个子块对应的目标;所述识别模型预先利用样本图像包含的目标、以及样本图像的多个子块的图像特征值而训练得到,1≤i≤N;
目标确定模块,用于:根据所述N个子块所对应的目标,基于所述识别模型确定出的空格,将相邻的若干个相同的字符合并为一个字符,确定所述输入图像中所包含的目标。
9.根据权利要求8所述的装置,所述特征提取模块,还用于:
将所述输入图像平均划分为所述N个子块。
10.根据权利要求8所述的装置,所述提取所述子块对应的图像特征值,包括:
利用卷积神经网络模型提取所述图像特征值,所述卷积神经网络模型预先利用样本图像训练得到。
11.根据权利要求8所述的装置,所述识别模型包括至少一层双向循环神经网络,输入至所述双向循环神经网络的数据具有时间顺序,所述时间顺序为所述N个子块在所述输入图像中的排列顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810175904.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序