[发明专利]理赔单据的字符识别方法及服务器有效

专利信息
申请号: 201710233613.3 申请日: 2017-04-11
公开(公告)号: CN107220648B 公开(公告)日: 2018-06-22
发明(设计)人: 金飞虎;薛燕;米艺;李欢欢;仇一 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 单据 字符识别 分割区域 框架格式 框线 服务器 区域分割 预先确定 排布 影像 析出 分析模型 调用 干涉 分析 统一
【说明书】:

发明公开了一种理赔单据的字符识别方法及服务器,该方法包括:服务器在收到待识别字符的理赔单据影像后,按照该理赔单据框架格式的框线排布进行区域分割,获得一个或多个分割区域;调用预先确定的分析模型对获得的各个分割区域进行分析,并利用预先确定的识别规则对分析出的各个分割区域分别进行字符识别,以识别出各个分割区域中的字符。本发明由于考虑到理赔单据框架格式对识别精度的影响,在进行字符识别前先按照理赔单据框架格式的框线排布进行区域分割,再针对各个分割区域来进行字符识别,避免了在对整个理赔单据影像中的字符进行统一识别时单据中的框线对字符识别的影响及干涉,能有效提高对理赔单据中字符的识别精度。

技术领域

本发明涉及计算机技术领域,尤其涉及一种理赔单据的字符识别方法及服务器。

背景技术

随着大众保险意识的增强、购买保险的客户群大幅增多,保险公司需处理的客户理赔申请越来越多,保险公司作业人员需录入的理赔单据影像也越来越多,以致于录单作业人员的人力紧张,同时,经常会出现录单错误。为了有效减少录单错误、提高录单效率,目前,有些保险公司在录单作业过程中引入OCR(Optical Character Recognition,光学字符识别)技术,以自动识别出理赔单据影像的字符以填充到对应的输入栏位中。

然而,现有的利用OCR技术进行理赔单据影像字符的识别方案仅利用自身的识别引擎对整个理赔单据影像中的字符进行统一识别,并未考虑理赔单据框架格式对识别精度的影响,也并未考虑单据中的框线对字符识别的干涉,使得现有的识别方案的识别精度不高,需要耗费大量的人力、物力进行校验。

发明内容

本发明的主要目的在于提供一种理赔单据的字符识别方法及服务器,旨在提高理赔单据的识别精度。

为实现上述目的,本发明提供的一种理赔单据的字符识别方法,所述方法包括以下步骤:

服务器在收到待识别字符的理赔单据影像后,按照该理赔单据框架格式的框线排布进行区域分割,获得一个或多个分割区域;

调用预先确定的分析模型对获得的各个分割区域进行分析,并利用预先确定的识别规则对分析出的各个分割区域分别进行字符识别,以识别出各个分割区域中的字符。

优选地,所述调用预先确定的分析模型对获得的各个分割区域进行分析的步骤包括:

调用预先确定的分析模型对获得的各个分割区域进行分析,以分析出可利用光学字符识别引擎识别的第一分割区域和不可利用光学字符识别引擎识别的第二分割区域;

所述利用预先确定的识别规则对分析出的各个分割区域分别进行字符识别的步骤还包括:

利用预先确定的光学字符识别引擎对各个所述第一分割区域进行字符识别,以识别出各个所述第一分割区域中的字符,并调用预先确定的识别模型对各个所述第二分割区域进行字符识别,以识别出各个所述第二分割区域中的字符。

优选地,所述预先确定的分析模型为卷积神经网络模型,所述预先确定的分析模型的训练过程如下:

A、针对预先确定的理赔单据框架格式,获取预设数量的基于该理赔单据框架格式的理赔单据影像样本;

B、对每一个理赔单据影像样本按照该理赔单据框架格式的框线排布进行区域分割,并确定出各个理赔单据影像样本中利用光学字符识别引擎识别错误的第三分割区域和利用光学字符识别引擎识别正确的第四分割区域;

C、将所有第三分割区域归入第一训练集,将所有第四分割区域归入第二训练集;

D、分别从所述第一训练集和所述第二训练集中提取出第一预设比例的分割区域作为待训练的分割区域,并将所述第一训练集和所述第二训练集中剩余的分割区域作为待验证的分割区域;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710233613.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top