[发明专利]一种图像文本识别的方法和装置有效
申请号: | 201611036897.9 | 申请日: | 2016-11-23 |
公开(公告)号: | CN108090400B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 程耀;宋刘一汉;杜安安;许宝亮 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 贾伟;张颖玲 |
地址: | 310012 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 识别 方法 装置 | ||
1.一种图像文本识别的方法,其特征在于,所述方法包括:
获取至少一种字符组合,利用获取的至少一种字符组合建立字符集,将所述字符集中每一种字符组合依据预设的构建方式生成对应的单行文本图像,利用所述生成的单行文本图像构建单行文本图像训练集;所述生成对应的单行文本图像包括:基于模拟自然场景的特点,将所述字符集中每一种字符组合扩展成具有不同形状及背景形成的图像;
利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;
利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。
2.根据权利要求1所述的方法,其特征在于,所述预设的构建方式包括:随机改变字符的形状,或随机的改变字符组合的背景或前景。
3.根据权利要求1所述的方法,其特征在于,在生成对应的单行文本图像之后,所述方法还包括:对所述单行文本图像进行缩放处理,使得缩放处理后的单行文本图像的宽度为预设的固定的像素。
4.根据权利要求1所述的方法,其特征在于,利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型,包括:利用卷积神经网络提取所述单行文本图像训练集中每一个单行文本图像对应的文本序列特征,利用所述文本序列特征训练递归神经网络LSTM识别模型,得到单行文本识别模型。
5.一种图像文本识别的装置,其特征在于,所述装置包括:构建模块、训练模块和识别模块;其中,
构建模块,用于获取至少一种字符组合,利用获取的至少一种字符组合建立字符集,将所述字符集中每一种字符组合依据预设的构建方式生成对应的单行文本图像,利用所述生成的单行文本图像构建单行文本图像训练集;所述生成对应的单行文本图像包括:基于模拟自然场景的特点,将所述字符集中每一种字符组合扩展成具有不同形状及背景形成的图像;
处理模块,用于利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;
识别模块,用于利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。
6.根据权利要求5所述的装置,其特征在于,所述预设的构建方式包括:随机改变字符的形状,或随机的改变字符组合的背景或前景。
7.根据权利要求5所述的装置,其特征在于,所述构建模块,还用于在生成对应的单行文本图像之后,对所述单行文本图像进行缩放处理,使得缩放处理后的单行文本图像的宽度为预设的固定的像素。
8.根据权利要求5所述的装置,其特征在于,所述处理模块,具体用于利用卷积神经网络提取所述单行文本图像训练集中每一个单行文本图像对应的文本序列特征,利用所述文本序列特征训练递归神经网络LSTM识别模型,得到单行文本识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团公司,未经中移(杭州)信息技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611036897.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动化光学图像识别方法及其装置
- 下一篇:线检测方法和线检测设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序