[发明专利]一种在票据中识别大写金额的方法有效
申请号: | 201811366005.0 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109727363B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 赵亮;刘贯伟;刘秀;武艳红 | 申请(专利权)人: | 恒银金融科技股份有限公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20;G06V30/148 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300308 天津市滨海*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 票据 识别 大写 金额 方法 | ||
本发明公开在票据中识别大写金额的方法,包括采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;对多种图像投影初次分割,选择通过求连通区域的方法将字符分开:或利用区域梯度图像,与卷积核卷积运算,利用像素点梯度,通过形成的分割路径将该子区域内的字符分开,最终形成字符分割算法;识别时,利用该字符分割算法对票据中的数字大写图像分割,形成单个字符然后输入到神经网识别模型中进行字符识别。本发明实现了对手写体大写金额的快速分割。
技术领域
本发明涉及图像识别技术领域,特别是涉及一种在票据中识别大写金额的方法。
背景技术
在票据鉴伪和识别中,针对票据图像,需要识别其中手写体的大写金额,如零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾等。识别过程一般分为三步:1.在图像中裁剪出包含手写体金额的大致范围。2.将手写体金额分割为单个的字符。3.用神经网络识别每个字符。
第一步较为简单,因为手写体金额在票据中的相对位置是固定的。第二步的难点在于,由于不同人的手写风格十分迥异,且存在连笔的情形,因此字符分割很难做到百分百精确。比如在连笔字的情形前一个汉字的某些笔画可能与后一个汉字合并在一起,或者两个十分接近的汉字被合并为一个汉字。在票据识别这种对识别率要求非常高的场景,寻找更准确的汉字字符分割算法是非常必要的。第三步的难点在于获取包含足够样本量的训练数据。目前开源的汉字手写体数据集(如模式识别国家重点实验室发表的HWDB数据集)都是针对大多数常用汉字的,其中大写数字的样本量较小。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种在票据中识别大写金额的方法。
为实现本发明的目的所采用的技术方案是:
一种在票据中识别大写金额的方法,包括步骤:
采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;
对多种所述图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:
计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将该梯度方向看作是该像素点的笔画方向;
从该子区域顶部的一个梯度为零的初始像素点开始,选择向下方梯度最小的像素点而向下移动以避开笔画方向,直到移动该子区域的底部为止,从而形成一条近似曲线的将该子区域内的字符分开的分割路径,将该分割路径用一条逐段线性的折线拟合,得到分割折线;最终形成字符分割算法;
识别时,利用该字符分割算法对票据中的数字大写图像进行分割,形成单个字符然后输入到神经网识别模型中进行字符识别。
所述卷积核采用7x7卷积核。
本发明从已有小的样本集出发,用程序生成样本量较大且随机性较好的样本图像,然后对这些样本图像进行分割,形成字符分割算法,实现对手写体大写金额的字符分割,从而实现了对手写体大写金额快速分割,为字符识别奠定的基础。
附图说明
图1所示为本发明的在票据中识别大写金额的方法的流程图;
图2所示为生成的变形手写体的图像;
图3所示为具有连通区域的子区域图像;
图4所示为不具有连通区域的子区域图像;
图5所示为图像分割后形成分割折线的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒银金融科技股份有限公司,未经恒银金融科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811366005.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于离散傅里叶变换的钞票磁信号识别方法
- 下一篇:一种自动分类收集投币机