[发明专利]票据识别方法、服务器及计算机可读存储介质在审
申请号: | 201810208586.9 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108446621A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 田野;刘鹏;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34;G06K9/40;G06K9/44;G06K9/62;G06Q40/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种票据识别方法,该方法包括接收待识别的票据图片,预先训练的票据图片识别模型对所述票据图片进行处理,使用预先训练的文本检测模型对所述票据图片进行文本检测,确定所述票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段,针对所述待识别字段,调用对应的文本识别模型进行字符识别,以分别识别出所述目标字符区域中的所述多个待识别字段包含的字符信息,并将识别的结果输出。本发明还提供一种服务器及计算机可读存储介质。本发明提供的票据识别方法、服务器及计算机可读存储介质能够提高票据的数字化效率,降低业务人员的工作强度,提高数据的准确性或精细化。 | ||
搜索关键词: | 票据 计算机可读存储介质 目标字符 票据识别 字段 服务器 文本检测 图片 图片识别 文本识别 字符识别 字符信息 精细化 调用 数字化 输出 | ||
【主权项】:
1.一种票据识别方法,应用于服务器,其特征在于,所述方法包括步骤:接收待识别的票据图片,利用预先训练的票据图片识别模型对所述票据图片进行处理得到处理后的票据图片;使用预先训练的文本检测模型对所述处理后的票据图片进行文本检测,确定所述处理后的票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段;针对所述待识别字段,调用对应的文本识别模型进行字符识别,所述文本识别模型识别出所述待识别字段包含的字符信息,并针对识别的所述字符信息生成置信度;及将所述置信度与预设的置信度阈值进行比较,若所述置信度高于所述置信度阈值,则按照预设方法输出所述目标字符区域包含的字符信息,若所述置信度低于所述置信度阈值,则将所述单据图片通过第三方进行检验识别,并将所述第三方检验识别的结果输出;其中,所述预设方法包括:保留票据单号前十位;使用tf‑idf算法中的余弦相似度匹配医院字段最佳的医院名称;在算法输出的原始字符串结果上提取出年月日作为日期;将大写汉字金额进行转阿拉伯数字处理;去除非相关字符并保留小数点后两位,对算法输出的所有金额部分进行格式统一。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810208586.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视频的目标智能追踪方法
- 下一篇:目标物体的检测跟踪方法及装置、终端