[发明专利]一种发票图片特定板块的定位、识别方法、系统、设备有效
申请号: | 201710724450.9 | 申请日: | 2017-08-22 |
公开(公告)号: | CN109426814B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 武晨 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/416;G06V30/42;G06V30/146;G06V30/148;G06V30/18 |
代理公司: | 北京志霖恒远知识产权代理有限公司 11435 | 代理人: | 曹丽 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发票 图片 特定 板块 定位 识别 方法 系统 设备 | ||
本发明涉及一种发票图片特定板块的定位、识别方法、系统、设备。该发票图片特定板块的定位、识别方法,包括:获取发票图片;确定待识别发票信息;根据待识别发票信息,对其所在发票图片的区域定位、分割,获得待识别发票信息图片;对待识别发票信息图片的文字内容进行识别,获取待识别发票信息。由于识别之前,直接针对目标进行定位、切割,故每一识别内容所对应的发票信息,清楚明了,开创新的实现了自动每一识别发票,填补了本技术领域的空白,具有广阔的应用前景。从根本上解决了现有图像识别算法只能无差别地识别发票图片中的每一个字符,但是无法将所需发票信息区分出来的弊端。使发票信息的获取真正实现了自动化。
技术领域
本发明涉及发票,尤其涉及一种发票图片特定板块的定位、识别方法、系统、设备。
背景技术
处理发票报销是公司财务部门的一项非常重要的工作,工作人员需要获取每张发票中的票号序列、公司名称、开票日期、金额和税额等信息进行下一步的验证等工作。工作繁重。
而传统的图像识别算法虽然能逐行无差别地识别发票图片中的每一个字,每一个符号,但是并不能识别出,哪一个字段是发票编号,哪一个字段是日期,哪一个字段是金额等。
因此,现在针对发票信息的获取仍然只能通过人为完成。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种发票图片特定板块的定位、识别方法、系统、设备。
根据本发明的一个方面,提供了一种发票图片特定板块的定位、识别方法,包括:
获取发票图片;
确定待识别发票信息;
根据待识别发票信息,对其所在发票图片的区域定位、分割,获得待识别发票信息图片;
对待识别发票信息图片的文字内容进行识别,获取待识别发票信息。
本发明通过任何简单的方法获得左右待处理发票的图片,然后通过一些图像处理方法将所有图片中以各种位置、各种旋转角度、各种亮度情况的发票有效区域截取并摆正,进而结合逻辑处理,采用Canny轮廓检测、图像文本检测、颜色检测、提取“行、列”的方法精确地定位到一张图片中每一个待识别的区域,并截取成为一个个的碎片,分别进行识别。由自动获取发票信息替代原人为方式。不但准确度高,而且大大提高了效率。
进一步的,待识别发票信息包括票号序列、公司名称、开票日期、金额和税额。
进一步的,获取发票图片之后包括截取发票有效区域。
进一步的,截取发票有效区域之前包括:摆正发票图片。
进一步的,摆正发票图片包括:
利用openCV的HoughLine算法检测发票图片中所有的线条;
计算每条线的偏转角度;
出现最多次的旋转角度为该图片的偏转角度;
根据偏转角度旋转所述图片,摆正发票图片。
进一步的,截取发票有效区域包括:
提取该发票图片中发票有效区域的轮廓;
基于该轮廓分割得到发票有效区域的图片。
进一步的,得到发票有效区域的图片之后执行步骤包括通过SIFT算法,判断发票票头的位置是否在图片的上方,否则,则上下翻转所述图片。其中,SIFT是一种电脑视觉的算法用来侦测与描述影像中的局部性特征。
进一步的,提取该发票图片中发票有效区域的轮廓,包括:
分别计算发票图片的每一像素列的像素值之和、每一像素行的像素值之和,得到两个向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710724450.9/2.html,转载请声明来源钻瓜专利网。