[发明专利]票据识别方法、服务器及计算机可读存储介质在审
申请号: | 201810208586.9 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108446621A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 田野;刘鹏;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34;G06K9/40;G06K9/44;G06K9/62;G06Q40/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 计算机可读存储介质 目标字符 票据识别 字段 服务器 文本检测 图片 图片识别 文本识别 字符识别 字符信息 精细化 调用 数字化 输出 | ||
本发明公开了一种票据识别方法,该方法包括接收待识别的票据图片,预先训练的票据图片识别模型对所述票据图片进行处理,使用预先训练的文本检测模型对所述票据图片进行文本检测,确定所述票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段,针对所述待识别字段,调用对应的文本识别模型进行字符识别,以分别识别出所述目标字符区域中的所述多个待识别字段包含的字符信息,并将识别的结果输出。本发明还提供一种服务器及计算机可读存储介质。本发明提供的票据识别方法、服务器及计算机可读存储介质能够提高票据的数字化效率,降低业务人员的工作强度,提高数据的准确性或精细化。
技术领域
本发明涉及图像识别领域,尤其涉及一种票据识别方法、服务器计算机可读存储介质。
背景技术
如今随着经济的发展和人们生活水平的提高,越来越多的人选择购买医疗,商业,金融等保险。其中某些保险公司慢慢开始了自助理赔业务,比如用户在进行医疗理赔过程中,只需要将门诊或住院发票拍照上传到保险公司系统,保险公司业务员会将用户上传的发票图片上的信息录入到理赔系统中,以进行下一步操作,这种方式大大方便了用户进行理赔的过程。但是另一方面,也增加了保险公司方面的工作压力。问题主要表现在需要花费大量的人力来处理用户上传的票据图像,许多时候业务员也会对单一的工作产生疲惫感,使得数据录入错误率升高。
通过引入票据识别技术,可以在一定条件下提高票据的数字化效率,降低业务人员的工作强度,提高数据的准确性或精细化。不同于传统的票据扫描识别技术,用户拍照上传的票据图片的识别难度大大增加,主要表现在用户的拍照环境不同,光照,旋转角度,图像清晰度,遮挡,甚至票据的完成程度都各不相同,这些因素都给票据识别过程带来了极大的挑战。
发明内容
有鉴于此,本发明提出一种票据识别方法及服务器,以解决如何快速、准确识别票据图片的问题。
首先,为实现上述目的,本发明提出一种票据识别方法,该方法包括步骤:
接收待识别的票据图片,预先训练的票据图片识别模型对所述票据图片进行处理得到处理后的票据图片;
使用预先训练的文本检测模型对所述处理后的票据图片进行文本检测,确定所述处理后的票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段;
针对所述待识别字段,调用对应的文本识别模型进行字符识别,所述文本识别模型识别出所述待识别字段包含的字符信息,并针对识别的所述字符信息生成置信度;及
将所述置信度与预设的置信度阈值进行比较,若所述置信度高于所述置信度阈值,则按照预设方法输出所述目标字符区域包含的字符信息,若所述置信度低于所述置信度阈值,则将所述单据图片通过第三方进行检验识别,并将所述第三方检验识别的结果输出;
其中,所述预设方法包括:保留票据单号前十位;使用tf-idf算法中的余弦相似度匹配医院字段最佳的医院名称;在算法输出的原始字符串结果上提取出年月日作为日期;将大写汉字金额进行转阿拉伯数字处理;去除非相关字符并保留小数点后两位,对算法输出的所有金额部分进行格式统一。
优选地,所述票据图片识别模型对所述票据图片进行处理包括:对所述票据图片进行分类处理、去噪处理、矫正处理及截取票据处理,将通过所述分类处理、去噪处理、矫正处理及截取票据处理的所述票据图片作为处理后的票据图片。
优选地,所述分类处理包括:将所述票据图片分为门诊票据,住院票据,以及其他类票据三种类别;所述去噪处理为:对所述票据图片进行图像平滑处理及小波滤波处理;所述矫正处理包括步骤:确定所述票据图片的票据中心点及所述票据图片中的印章中心点的位置,根据所述票据中心点与印章中心点的相对位置关系,确定票据的旋转角度,根据该角度把票据旋转到水平方向;所述截取票据为:将票据从原始票据图片中截取出来,去除原始票据图片的背景图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810208586.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视频的目标智能追踪方法
- 下一篇:目标物体的检测跟踪方法及装置、终端