[发明专利]票据识别方法、服务器及计算机可读存储介质在审
申请号: | 201810208586.9 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108446621A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 田野;刘鹏;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34;G06K9/40;G06K9/44;G06K9/62;G06Q40/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 计算机可读存储介质 目标字符 票据识别 字段 服务器 文本检测 图片 图片识别 文本识别 字符识别 字符信息 精细化 调用 数字化 输出 | ||
1.一种票据识别方法,应用于服务器,其特征在于,所述方法包括步骤:
接收待识别的票据图片,利用预先训练的票据图片识别模型对所述票据图片进行处理得到处理后的票据图片;
使用预先训练的文本检测模型对所述处理后的票据图片进行文本检测,确定所述处理后的票据图片中包括字符的目标字符区域及所述目标字符区域包括的待识别字段;
针对所述待识别字段,调用对应的文本识别模型进行字符识别,所述文本识别模型识别出所述待识别字段包含的字符信息,并针对识别的所述字符信息生成置信度;及
将所述置信度与预设的置信度阈值进行比较,若所述置信度高于所述置信度阈值,则按照预设方法输出所述目标字符区域包含的字符信息,若所述置信度低于所述置信度阈值,则将所述单据图片通过第三方进行检验识别,并将所述第三方检验识别的结果输出;
其中,所述预设方法包括:保留票据单号前十位;使用tf-idf算法中的余弦相似度匹配医院字段最佳的医院名称;在算法输出的原始字符串结果上提取出年月日作为日期;将大写汉字金额进行转阿拉伯数字处理;去除非相关字符并保留小数点后两位,对算法输出的所有金额部分进行格式统一。
2.如权利要求1所述的票据识别方法,其特征在于,所述票据图片识别模型对所述票据图片进行处理包括:对所述票据图片进行分类处理、去噪处理、矫正处理及截取票据处理,将通过所述分类处理、去噪处理、矫正处理及截取票据处理的所述票据图片作为处理后的票据图片。
3.如权利要求2述的票据识别方法,其特征在于,所述分类处理包括:将所述票据图片分为门诊票据,住院票据,以及其他类票据三种类别;所述去噪处理为:对所述票据图片进行图像平滑处理及小波滤波处理;所述矫正处理包括步骤:确定所述票据图片的票据中心点及所述票据图片中的印章中心点的位置,根据所述票据中心点与印章中心点的相对位置关系,确定票据的旋转角度,根据该角度把票据旋转到水平方向;所述截取票据为:将票据从原始票据图片中截取出来,去除原始票据图片的背景图片。
4.如权利要求1-3所述的票据识别方法,其特征在于,所述票据图片识别模型为深度卷积神经网络,该深度卷积神经网络为在CaffeNet的环境下选取的基于深度卷积神经网络SSD(Single Shot MultiBox Detector)的算法模型,所述票据图片识别模型的训练过程包括步骤:
为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
将所述每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将所述各个验证子集中的图片样本进行混合以得到验证集;
利用所述训练集训练所述票据图片识别模型;及
利用所述验证集验证训练的所述票据图片识别模型的准确率,若准确率大于或者等于预设准确率,则训练结束;若准确率小于所述预设准确率,则增加所述每一个预设图片类别对应的图片样本的数量,并重新执行以上步骤;
其中,所述预设图片类别包括门诊票据和住院票据,所述预设数量为1000张,所述第一比例及第二比例为80%、20%。
5.如权利要求1所述的票据识别方法,其特征在于,所述文本检测模型为基于CaffeNet的CTPN(Connectionist Text Proposal Network)模型,所述文本检测模型对所述处理后的票据图片的字符区域进行区域识别,从所述处理后的票据图片上识别出包含字符信息且固定宽度为预设值的小框,将处于同一行包含字符信息的小框按照先后顺序拼接在一起,形成包含字符信息的目标行字符区域,其中,所述预设值为16个像素宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810208586.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视频的目标智能追踪方法
- 下一篇:目标物体的检测跟踪方法及装置、终端