[发明专利]基于深度学习的移动终端文字识别方法及系统有效
申请号: | 201911008598.8 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110766017B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 朱帕尔·努尔兰;文云;黎红;杨柳;马倩;杨丽娜;王晓玉;王巧莉;薛高倩;贾俊强;李坤源;苟亮;王平;迪力尼亚·迪力夏提;马占军 | 申请(专利权)人: | 国网新疆电力有限公司信息通信公司;国家电网有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/18 |
代理公司: | 乌鲁木齐合纵专利商标事务所 65105 | 代理人: | 周星莹;汤洁 |
地址: | 830001 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 移动 终端 文字 识别 方法 系统 | ||
1.一种基于深度学习的移动终端文字识别方法,其特征在于,包括以下步骤:
对图片中的文本进行文字分割,分割为若干个文字图片,并将文字图片按分割顺序形成文字图片数组;
对每一个文字图片进行预处理,预处理包括大小调整、灰度转换、滤波、全局阈值二值化和剪裁;
通过CNN+Bi-RNN字符分割模型对每一个文字图片中的单个字符进行定位,确定字符分割线位置,根据分隔线位置分割每一个字符,形成字符图片;
按分割顺序对每个字符图片赋予地址,并形成字符图片数组;
将字符图片数组中的字符图片依序进行识别,并按识别顺序形成文字数组;
根据字符图片数组索引读出文字文本,完成文字识别。
2.根据权利要求1所述的基于深度学习的移动终端文字识别方法,其特征在于,所述将字符图片数组中的字符图片依序进行识别,包括:
对每个字符图片进行预处理,预处理过程包括全局阈值二值化、调整像素;
通过CNN字符识别算法模型对字符图片数组中的字符图片依序进行识别,并按识别顺序形成文字数组。
3.根据权利要求1所述的基于深度学习的移动终端文字识别方法,其特征在于,所述根据字符图片数组索引读出文字文本,包括:
对字符图片数组中的字符图片进行排序;
根据排序后的字符图片索引对应的读出文字文本。
4.根据权利要求1或2或3所述的基于深度学习的移动终端文字识别方法,其特征在于,所述对图片中的文本进行文字分割,分割为若干个文字图片,包括:
对原图片进行预处理,删除原图片中的多余背景,获取文本图片;
对每个文本图片中文字进行分割,获取若干个文字图片;
按分割顺序对每个文字图片赋予地址,并形成文字图片数组。
5.根据权利要求4所述的基于深度学习的移动终端文字识别方法,其特征在于,所述获取文本图片,包括:
通过轮廓检测获取整体文本图片;
通过轮廓检测对整体文本图片中的每行进行分割,获取多个文本图片,按分割顺序形成文本图片数组。
6.一种根据权利要求1至5中任意一项所述的基于深度学习的移动终端文字识别系统,其特征在于,包括文字图片分割单元、字符图片分割单元、字符图片识别单元和识别输出单元;
文字图片分割单元,对图片中的文本进行文字分割,分割为若干个文字图片,并将文字图片按分割顺序形成文字图片数组;
字符图片分割单元,将所有文字图片再次定位分割,分割形成单个字符的字符图片,并按分割顺序形成字符图片数组;
字符图片识别单元,将字符图片数组中的字符图片依序进行识别,并按识别顺序形成文字数组;
识别输出单元,根据字符图片数组索引读出文字文本,完成文字识别。
7.根据权利要求6所述的基于深度学习的移动终端文字识别方法,其特征在于,所述文字图片分割单元包括原图片预处理模块和分割模块;
原图片预处理模块,对原图片进行预处理,删除原图片中的多余背景,获取文本图片;
分割模块,对每个文本图片中文字进行分割,获取若干个文字图片;按分割顺序对每个文字图片赋予地址,并形成文字图片数组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司信息通信公司;国家电网有限公司,未经国网新疆电力有限公司信息通信公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911008598.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于概率神经网络的喷码字符识别方法
- 下一篇:一种棒材自动计数方法及装置