[发明专利]单据识别方法、装置、计算机设备和存储介质有效
申请号: | 202010399997.8 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111291741B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 熊肇煜;化成君;任伟 | 申请(专利权)人: | 太平金融科技服务(上海)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 201201 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单据 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种单据识别方法,其特征在于,所述方法包括:
获取单据图像,所述单据图像为医疗保险相关的单据图像,所述单据图像包括背景部分以及前景部分,背景部分是指单据印刷过程中所印制的标准框架信息,前景部分是指在打印过程中打印的打印信息,所述打印过程中打印的打印信息与印刷过程中所印制的标准框架信息存在串行;
对所述单据图像中的打印信息进行前景提取,得到所述单据图像中待识别文本的待识别图像,所述待识别图像包括所述单据图像中的打印信息,所述打印信息是对单据进行打印填写时所填写的信息,所述打印填写时所填写的信息为标准文本格式的文本内容;
对所述待识别图像进行参考文本的识别,得到所述参考文本的参考坐标位置,所述参考文本为打印信息中不变的文本内容;
获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置,所述非参考文本为打印信息中除去参考文本的文本内容;
获取所述非参考文本的长宽尺寸;
基于所述相对坐标位置以及所述参考坐标位置,对所述非参考文本进行识别,得到所述单据图像中待识别文本的识别结果,包括:基于所述相对坐标位置以及所述参考坐标位置,得到所述非参考文本的绝对坐标位置;根据所述非参考文本的绝对坐标位置以及所述长宽尺寸,确定所述非参考文本在所述待识别图像中的目标区域;对所述目标区域进行文本识别,得到所述非参考文本的识别结果;遍历所述待识别文本中的非参考文本,得到所述单据图像中待识别文本的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置之前,所述方法还包括:
获取对应所述单据图像的单据模板;
所述获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置,包括:
从对应所述单据图像的单据模板中获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置。
3.根据权利要求1所述的方法,其特征在于,所述对所述单据图像中的打印信息进行前景提取,得到所述单据图像中待识别文本的待识别图像,包括:
根据图像色彩对所述单据图像进行分类,得到所述单据图像中待识别文本与背景的二分类结果;
对所述二分类结果进行二值转换,得到所述单据图像中待识别文本的待识别图像。
4.根据权利要求3所述的方法,其特征在于,所述根据图像色彩对所述单据图像进行分类,得到所述单据图像中待识别文本与背景的二分类结果,包括:
对所述单据图像进行图像色彩的转换,得到对应所述单据图像中各像素点的色彩参数;
基于预设阈值以及所述色彩参数,对所述单据图像的各像素点进行分类,得到所述单据图像中待识别文本与背景的二分类结果。
5.根据权利要求1所述的方法,其特征在于,所述基于所述相对坐标位置以及所述参考坐标位置,对所述非参考文本进行识别,得到所述单据图像中待识别文本的识别结果之后,还包括:
按照预先设置的存储要求,对所述识别结果进行结构化存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太平金融科技服务(上海)有限公司,未经太平金融科技服务(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010399997.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气缸盖与一种燃气发动机
- 下一篇:打开和关闭门或窗的锁的手动控制装置