[发明专利]识别票据图像中的字段的方法、装置、设备和介质在审
申请号: | 201911164957.9 | 申请日: | 2019-11-25 |
公开(公告)号: | CN111126151A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 王亚领;刘设伟;刘昊岳 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/38;G06K9/46;G06Q40/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 郭晗;赵迪 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 票据 图像 中的 字段 方法 装置 设备 介质 | ||
本发明公开了识别票据图像中的字段的方法、装置、设备和介质,涉及计算机技术领域。该方法的一具体实施方式包括:将票据图像进行二值化处理,得到二值化票据图像;在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;识别所述文本区域的字段颜色;当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。该实施方式能够快速精准的识别出票据的字段。
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别票据图像中的字段的方法、装置、设备和计算机可读介质。
背景技术
在保险的核赔环节中,客户上传多张理赔单据,其中票据的信息尤为重要。在对票据进行光学字符识别(Optical Character Recognition,OCR)识别的过程中,需要从客户上传票据中识别出用于核赔的字段。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
票据没有统一制式、排版格式迥异,可能出现打印错位严重,因此很难找出字段。并且票据上字段周围往往打印有其他数字,造成字段的识别非常困难。
发明内容
有鉴于此,本发明实施例提供一种识别票据图像中的字段方法、装置、设备和计算机可读介质,能够快速精准的识别出票据的字段。
为实现上述目的,根据本发明实施例的一个方面,提供了一种识别票据图像中的字段的方法,包括:
将票据图像进行二值化处理,得到二值化票据图像;
在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别所述文本区域的字段颜色;
当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
所述识别所述文本区域的字段颜色,包括:
将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像;
基于所述色调饱和度明度的图像的数值,获知所述文本区域的每个像素的颜色;
按照相同颜色像素的数量从多到少的顺序,排列颜色;
将排序第二的颜色,作为所述文本区域的字段颜色。
所述将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像,包括:
按照色调饱和度明度的色彩空间表,将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像。
所述将票据图像进行二值化处理,得到二值化票据图像之后,还包括:
在所述二值化票据图像中检测到图形标识符的情况下,则识别所述图形标识符,以确定字段识别结果。
所述在所述票据图像中,定位满足预设字段长度的文本区域,包括:
检测所述票据图像,得到多个文本区域;
在所述多个文本区域中,定位与所述预设字段长度一致的文本区域。
所述图形标识符包括条形码或二维码。
所述字段长度包括字符的数量。
根据本发明实施例的第二方面,提供了一种识别票据图像中的字段的装置,包括:
处理模块,用于将票据图像进行二值化处理,得到二值化票据图像;
定位模块,用于在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911164957.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序