[发明专利]一种基于金融领域应用场景的字符识别方法在审
申请号: | 202010182564.7 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111340032A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 赵富强;余炅桦;徐雪 | 申请(专利权)人: | 天津得迈科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06K9/68;G06N3/04 |
代理公司: | 合肥律众知识产权代理有限公司 34147 | 代理人: | 殷娟 |
地址: | 300457 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 金融 领域 应用 场景 字符 识别 方法 | ||
本发明涉及字符识别,具体涉及一种基于金融领域应用场景的字符识别方法,对单据进行扫描,对扫描后的图像进行前景提取,将单据从图像背景中分离出来,从单据中提取识别检测区域图片,利用训练后的手写体识别模型,对手写体检测区域图片进行识别,利用训练后的打印体识别模型,对打印体检测区域图片进行识别,汇总识别结果并输出;本发明提供的技术方案能够有效克服现有技术所存在的无法自动提取单据内的固定文本区域、不能对单据内不同字体的字符进行有效识别的缺陷。
技术领域
本发明涉及字符识别,具体涉及一种基于金融领域应用场景的字符识别方法。
背景技术
目前,我国正处于金融自动化、智能化阶段,金融被认为是人工智能落地最快的领域之一,智能金融也被列入国家发展规划,依托人工智能技术能够为客户提供更加便捷的交互服务。人工智能在金融领域的应用将彻底改变当前人类的生产模式,取代更多人、更多重复性的工作,劳动密集型的工作将完全由机器人完成,人力将投入到更具价值的事情。
在金融领域,传统业务办理、报销流程办理过程繁琐,涉及到一系列票据填写、手写签字确认等人工办理流程,使得对公业务服务效率极低、客户体验感较差,对银行的业务拓展极为不利。另外,传统票据报销需要人工确认、核对手写报销金额,使得企业办公效率低下。OCR识别为上述问题的有效解决带来了曙光,研究OCR识别技术,大量票据填写、手写签字确认等需要人工进行的工作,均可交由智能设备通过OCR识别技术完成,将极大简化办理流程、节省人力和时间成本,提高企业竞争力。
涉及金融单据字符识别,主要具有以下难点:
一、用于建模的实际单据数据量较少且较难获得;
二、单据内的固定文本区域如何自动提取;
三、如何对单据内不同字体的字符进行识别。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种基于金融领域应用场景的字符识别方法,能够有效克服现有技术所存在的无法自动提取单据内的固定文本区域、不能对单据内不同字体的字符进行有效识别的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于金融领域应用场景的字符识别方法,包括以下步骤:
S1、对单据进行扫描,对扫描后的图像进行前景提取,将单据从图像背景中分离出来;
S2、从单据中提取识别检测区域图片;
S3、利用训练后的手写体识别模型,对手写体检测区域图片进行识别;
S4、利用训练后的打印体识别模型,对打印体检测区域图片进行识别;
S5、汇总识别结果并输出。
优选地,所述对扫描后的图像进行前景提取,将单据从图像背景中分离出来,包括以下步骤:
S1、进行前景增强,通过中值滤波、二值化、灰度化增大单据与图像背景的色差;
S2、进行单据分割,通过统计扫描图像在水平方向、竖直方向上的像素和判定单据在扫描图像上的边界,并将单据与图像背景分离。
优选地,所述中值滤波的方框尺寸为257。
优选地,若所述水平方向上的像素和超过设定阈值,则判断该行为单据所在区域;若所述竖直方向上的像素和超过设定阈值,则判断该列为单据所在区域。
优选地,所述从单据中提取识别检测区域图片,包括以下步骤:
S1、利用相对坐标法对单据中的检测区域图片进行分割提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津得迈科技有限公司,未经天津得迈科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182564.7/2.html,转载请声明来源钻瓜专利网。