[发明专利]图像识别方法及电子设备有效
申请号: | 201610506416.X | 申请日: | 2016-06-29 |
公开(公告)号: | CN107545223B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 孙广宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李梅香;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 电子设备 | ||
1.一种图像识别方法,其特征在于,包括:
获取待识别图像;
检测出所述待识别图像中图形对象的边缘点,并确定所述边缘点的梯度方向;
基于所述梯度方向确定出属于同一个待识别字符的边缘点,并将所述属于同一个待识别字符的边缘点进行合并,组成待识别字符;
提取所述待识别字符的外边框;
利用包含有预设变换的图形对象的训练图像和所述训练图像对应的预设结果,进行神经网络训练,获得指定神经网络;
其中,所述预设变换包括以下至少之一:倾斜、不同视角的透视、弯曲、旋转、以及图形的滤镜效果;
将所述外边框和所述待识别图像输入所述指定神经网络,以对所述待识别字符进行识别,并获得识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述利用包含有预设变换的图形对象的训练图像和所述训练图像对应的预设结果进行神经网络训练,包括:
利用数学变换对图形对象进行所述预设变换,获得所述包含有预设变换的图形对象的训练图像;
利用所述包含有预设变换的图形对象的训练图像及预设结果,对神经网络进行训练获得所述指定神经网络的网络参数。
3.根据权利要求1所述的方法,其特征在于,
所述检测出待识别图像中的边缘点,并确定所述边缘点的梯度方向,包括:
检测出所述待识别图像中边缘点;所述边缘点包括第一边缘点p;
确定所述p的第一梯度方向;
以所述p为起点,沿所述第一梯度方向搜索所述边缘点中的第二边缘点q;其中,所述q的梯度方向为第二梯度方向;所述第一梯度方向和所述第二梯度方向满足第一预设条件;
所述基于所述梯度方向确定出属于同一个待识别字符的边缘点,并将所述属于同一个待识别字符的边缘点进行合并,组成待识别字符,包括:
若存在至少一个所述q,则确定所述p和所述q属于同一待识别字符;
根据所述p和所述q的距离,确定所述待识别字符的笔画宽度;
将所有笔画宽度满足第二预设条件的边缘点合并,组成所述待识别字符。
4.根据权利要求3所述的方法,其特征在于,
所述第一梯度方向和所述第二梯度方向满足第一预设条件,包括:
所述第一梯度方向dp和所述第二梯度方向dq满足如下函数关系:
其中,所述θ为预设值。
5.一种图像识别装置,其特征在于,包括:
获取单元,用于获取待识别图像;
确定单元,用于检测出所述待识别图像中图形对象的边缘点,并确定所述边缘点的梯度方向;
所述确定单元,还用于确定基于所述梯度方向确定出属于同一个待识别字符的边缘点,并将所述属于同一个待识别字符的边缘点进行合并,组成待识别字符;
提取单元,用于提取所述待识别字符的外边框;
训练单元,用于利用包含有预设变换的图形对象的训练图像和所述训练图像对应的预设结果,进行神经网络训练,获得指定神经网络;
其中,所述预设变换包括以下至少之一:倾斜、不同视角的透视、弯曲、旋转、以及图形的滤镜效果;
识别单元,用于将所述外边框和所述待识别图像输入所述指定神经网络,以对所述待识别字符进行识别,并获得识别结果。
6.根据权利要求5所述的装置,其特征在于,
所述训练单元,还用于利用数学变换对图形对象进行所述预设变换,获得所述包含有预设变换的图形对象的训练图像;利用所述包含有预设变换的图形对象的训练图像及预设结果,对神经网络进行训练获得所述指定神经网络的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;北京大学,未经腾讯科技(深圳)有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610506416.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:集成式对讲机电路
- 下一篇:一次性硬膜外穿刺组件
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序