[发明专利]票据识别方法、服务器及计算机可读存储介质在审

专利信息
申请号: 201810208586.9 申请日: 2018-03-14
公开(公告)号: CN108446621A 公开(公告)日: 2018-08-24
发明(设计)人: 田野;刘鹏;王健宗;肖京 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/32;G06K9/34;G06K9/40;G06K9/44;G06K9/62;G06Q40/08
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种票据识别方法,该方法包括接收待识别的票据图片,预先训练的票据图片识别模型对所述票据图片进行处理,使用预先训练的文本检测模型对所述票据图片进行文本检测,确定所述票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段,针对所述待识别字段,调用对应的文本识别模型进行字符识别,以分别识别出所述目标字符区域中的所述多个待识别字段包含的字符信息,并将识别的结果输出。本发明还提供一种服务器及计算机可读存储介质。本发明提供的票据识别方法、服务器及计算机可读存储介质能够提高票据的数字化效率,降低业务人员的工作强度,提高数据的准确性或精细化。
搜索关键词: 票据 计算机可读存储介质 目标字符 票据识别 字段 服务器 文本检测 图片 图片识别 文本识别 字符识别 字符信息 精细化 调用 数字化 输出
【主权项】:
1.一种票据识别方法,应用于服务器,其特征在于,所述方法包括步骤:接收待识别的票据图片,利用预先训练的票据图片识别模型对所述票据图片进行处理得到处理后的票据图片;使用预先训练的文本检测模型对所述处理后的票据图片进行文本检测,确定所述处理后的票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段;针对所述待识别字段,调用对应的文本识别模型进行字符识别,所述文本识别模型识别出所述待识别字段包含的字符信息,并针对识别的所述字符信息生成置信度;及将所述置信度与预设的置信度阈值进行比较,若所述置信度高于所述置信度阈值,则按照预设方法输出所述目标字符区域包含的字符信息,若所述置信度低于所述置信度阈值,则将所述单据图片通过第三方进行检验识别,并将所述第三方检验识别的结果输出;其中,所述预设方法包括:保留票据单号前十位;使用tf‑idf算法中的余弦相似度匹配医院字段最佳的医院名称;在算法输出的原始字符串结果上提取出年月日作为日期;将大写汉字金额进行转阿拉伯数字处理;去除非相关字符并保留小数点后两位,对算法输出的所有金额部分进行格式统一。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810208586.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top