[发明专利]一种图像识别方法、装置、系统和计算设备在审
申请号: | 201610744133.9 | 申请日: | 2016-08-26 |
公开(公告)号: | CN107784316A | 公开(公告)日: | 2018-03-09 |
发明(设计)人: | 曹恩华;张帆;易东;楚汝峰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 系统 计算 设备 | ||
1.一种图像识别方法,其特征在于,包括:
根据汉字参数和背景图像,合成自然场景对应汉字图像;
采用各个自然场景对应汉字图像建立汉字图像数据库;
对所述汉字图像数据库进行训练,确定与汉字图像对应的识别信息,其中,所述识别信息基于深度卷积网络确定;
采用所述识别信息对待识别图像进行处理,识别所述待识别图像中包含的汉字。
2.根据权利要求1所述的方法,其特征在于,所述对所述汉字图像数据库进行训练,确定与汉字图像对应的识别信息,包括:
从所述汉字图像数据库中获取各汉字图像;
采用所述各汉字图像训练基于深度卷积网络的学习信息,生成与汉字图像对应的识别信息。
3.根据权利要求2所述的方法,其特征在于,采用所述各汉字图像训练基于深度卷积网络的学习信息,生成与汉字图像对应的识别信息,包括:
将各汉字图像采用所述学习信息进行处理,确定第一识别结果;
通过所述第一识别结果和实际结果的比较确定差值,依据所述差值调整所述学习信息的矩阵权值;
基于调整的学习信息生成与汉字图像对应的识别信息。
4.根据权利要求3所述的方法,其特征在于,将各汉字图像采用所述学习信息进行处理,确定第一识别结果,包括:
依据所述学习信息,采用各层矩阵逐级对所述汉字图像进行分析处理,确定所述汉字图像对应的特征信息和分类信息;
依据所述特征信息和分类信息确定所属汉字的概率,生成第一识别结果。
5.根据权利要求3所述的方法,其特征在于,通过所述第一识别结果和实际结果的比较确定差值,依据所述差值调整所述学习信息的矩阵权值,包括:
将第一识别结果和实际结果进行比较确定差值;
通过对所述差值的误差处理确定调整权值,采用所述调整权值对所述学习信息进行调整。
6.根据权利要求1所述的方法,其特征在于,采用所述识别信息对待识别图像进行处理,识别所述待识别图像中包含的汉字,包括:
采用所述识别信息对待识别图像进行特征提取,确定所述待识别图像的汉字特征;
采用分类器对所述汉字特征进行分类处理,确定所述待识别图像对应的汉字分类结果;
依据所述汉字分类结果确定所述待识别图像中包含的汉字。
7.根据权利要求6所述的方法,其特征在于,所述采用分类器对所述汉字特征进行分类处理,确定所述待识别图像对应的汉字分类结果,包括:
采用分类器对所述汉字特征进行分类处理,确定所述待识别图像在汉字字典中对应各汉字分类的概率;
依据在汉字字典中对应各汉字分类的概率,确定待识别图像的分类标签,其中,一个汉字对应一个分类标签。
依据所述待识别图像的分类标签和分类标签对应汉字字典中的汉字,确定所述待识别图像对应的汉字分类结果。
8.根据权利要求7所述的方法,其特征在于,依据所述汉字分类结果确定所述待识别图像中包含的汉字,包括:
确定各汉字分类的最大概率,将最大概率对应汉字确定为所述待识别图像中包含的汉字。
9.根据权利要求1所述的方法,其特征在于,所述根据汉字参数和背景图像,合成自然场景对应汉字图像,包括:
将依据所述汉字参数确定的各种字体的汉字与所述背景图像分别进行合成,确定自然场景对应的汉字图像;
其中,一个汉字图像为一种字体的汉字处于一个自然场景下的图像。
10.根据权利要求9所述的方法,其特征在于,所述汉字参数包括:汉字字典和字体文件。
11.根据权利要求10所述的方法,其特征在于,所述将依据所述汉字参数确定的各种字体的汉字与所述背景图像分别进行合成,确定自然场景对应的汉字图像,包括:
针对每个汉字,采用汉字字典和字体文件生成各种字体的汉字;
模拟自然场景对各种字体的汉字和背景图像分别进行合成处理,生成自然场景对应的汉字图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610744133.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路桥梁用减震支座
- 下一篇:一种市政桥梁用的伸缩缝覆盖装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序