[发明专利]一种基于标题位置参照模板的票据图像位置精确修正方法在审
申请号: | 202010422916.1 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111582222A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 牛殿峰;赵合喜;毕莹;张明辉;张永江;张娜;王秀燕;张雪;王芪;杨柏欢;王众;刘伟;孔祥靖;郭云峰;刘俊娥 | 申请(专利权)人: | 国网吉林省电力有限公司;国网吉林省电力有限公司电力科学研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 陈宏伟 |
地址: | 130022 吉林省*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标题 位置 参照 模板 票据 图像 精确 修正 方法 | ||
本发明提供一种基于标题位置参照模板的票据图像位置精确修正方法,对于特定的票据将基于标题位置参照模板作为参照物,自动化地逐步调整票据方向和位置,实现了一种据图像位置精确修正方法。利用本发明的方法,使用者仅需要在票据图像中点击票据标题的第一个字和最后一个字,本发明方法就可以自动化的对票据位置、方向、大小进行更加精确的修正,为识别票据关键内容打下坚实基础。
技术领域:
本发明涉及图像位置校准处理技术领域,具体涉及到一种基于标题位置参照模板的票据图像位置精确修正方法。
背景技术:
当前现代财务管理过程中很多企业和单位已经将票据进行了电子化存储,如果能够识别这些票据中的具体上下文信息(如:一次购买耗材的列表,特定宾馆的费用明细)将能够形成企业财务票据内容大数据,这些数据可以为企业管理、发现财务漏洞以及廉政建设提供重要的数据支撑,因此十分有必要进行票据影像内容的识别。
当前OCR技术已经较为成熟,可以较容易的识别图像中的文字,然而票据内容不同于一般的书本内容,所需的信息来自于特定的位置区域(如:某种发票的明细固定处在票据表格的某一特定位置),我们只有正确定位了这一区域,才能保证识别到信息的准确和完备性。在票据的图像化过程中,由于拍摄的人、设备以及环境多种多样,所以收集到的票据通常有一定所位置、大小和方向的偏差;这些偏差导致我们无法准确的定位特定的区域,进而影响了图像中所需信息的获取。因此对于票据图像十分有必要对其位置、大小和方向进行细致的修正。
对于图像位置的修正,当前采用的主流方法是:一、将票据影像作为一个在特定背景下的矩形(黑背景下的白色纸票据),在识别其边界或文字排列方向之后构造可能的票据外框多边形(如在图像中票据可能呈现为平行四边形),基于该多边形和目标矩形在几何上的差距,计算旋转、缩放的程度然后进行整个图像的变换,获得最终的修正结果。这种方式可以达到较高的自动化,然而在实际工作中较难严格限制报销人的使用的票据拍摄背景和图像裁剪方式,某些情况下拍摄环境背景存在多种颜色,拍摄设备在图像边界畸变情况不一、图像文件裁剪不当以及票据内部文字本身存在多种方向,均会对以上描述的修正过程造成影响,使得以上过程很难达到“位置精确”这一目标,最终校准的图像位置会有存在随机的误差,这些误差最终会导致无法严格的确定图像中所需的区域。二、是采用纯人工的方式,人工的不断对票据进行观察和调整,这种方式虽然可以解决扫描图像存在的复杂性,但是需要大量的人工与计算机的交互迭代操作,所以耗费时间和人力成本较高,在业务量大的时候难于满足要求。
面对“位置精确”这一目标,以及多种多样的票据、背景以及拍摄条件,完全无人参与利用自动算法进行修正和完全依赖人工手段进行修正均难于完成目标,因此需要引入新的方法,引入人的决策、参照物和自动化算法票据位置的精确修正。
发明内容
本发明提供一种基于标题位置参照模板的票据图像位置精确修正方法,对于特定的票据将基于标题位置参照模板作为参照物,自动化地逐步调整票据方向和位置,实现了一种据图像位置精确修正方法。
本发明所述的一种基于标题位置参照模板的票据图像位置精确修正方法,包括以下步骤:
S1,输入标题位置参照模板表TemplateTable,输入待修正影像InvoiceImage,输入InvoiceImage对应的票据的类型名称InvoiceTypeName;获取InvoiceImage对应的标题位置参照模板CurrentTemplate,InvoiceImage的宽度IWidth和高度IHeight,修正后影像CorrectedImage;
S101,输入标题位置参照模板表TemplateTable;TemplateTable为一个表,该表包含以下两个字段:
TemplateTableTypeName,票据的类型名称,该字段为字符串类型,该字段为TemplateTable的主键;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网吉林省电力有限公司;国网吉林省电力有限公司电力科学研究院,未经国网吉林省电力有限公司;国网吉林省电力有限公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010422916.1/2.html,转载请声明来源钻瓜专利网。