[发明专利]证件图像分类方法、装置、计算机设备及可读存储介质有效
申请号: | 201910979547.3 | 申请日: | 2019-10-15 |
公开(公告)号: | CN111046879B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 黄文韬;刘鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/148;G06V30/19;G06F40/216;G06F40/289 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证件 图像 分类 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请实施例提供了一种证件图像分类方法、装置、计算机设备及可读存储介质。本申请实施例属于证件图像分类技术领域,通过获取待分类的证件图像,基于OCR模型提取证件图像中包含的所有字段,根据字段,通过第一预设方式生成证件图像的向量,判断预设的向量集中是否存在与证件图像的向量相匹配的向量,其中,向量集包括多个通过第一预设方式所生成的、对应于不同证件类型的证件图像的向量;若向量集中存在与证件图像的向量相匹配的向量,将与证件图像的向量相匹配的向量作为目标向量,并根据目标向量对应的证件类型确定证件图像的证件类型,能够提高证件图像分类的准确性。
技术领域
本申请涉及证件图像分类技术领域,尤其涉及一种证件图像分类方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着人工智能技术的不断发展,各种深度学习模型的应用已经渗透到我们生活的方方面面。应用于不同目的的各种深度学习模型开始伴随着不同的服务应用到我们的生活中,如物体识别、文本检测及语音识别等各种类型的深度学习模型。其中基于深度学习的文本识别模型在帮助人们采集现实中各个文本包含的文本信息方面发挥着巨大的作用,比如对车牌等标识文字的识别、对打印内容或者手写内容的提取,或者对证件信息的收集等各个应用场景发挥着越来越大的作用。
其中,基于OCR文字识别的文本识别对信息的提取已经应用的相当广泛,通过OCR文字识别对文本进行检测和识别的精度及准确度在多年的发展中一直在不断提高,其中,OCR,英文为Optical Character Recognition,光学字符识别。通常来说,通用的OCR识别模型是对输入文本图像直接进行无差别的全文识别。但是随着更加广泛的应用和更加精细化的需求,很多情况下,人们所需要的并不是一个证件的全部内容,而是对于不同证件会有不同的定制化需求,需要从证件对应的目标文件中定向提取预设的部分信息,这时如果仅仅依靠通用OCR模型的识别很难满足定向提取的需求,所以一般的OCR识别有时难以满足人们的一些定制化的需要。因此,面对一些定制化需求的时候,就需要针对不同类型的证件定制提取对应文字内容的逻辑,也即针对不同类型的证件进行对应内容提取等处理算法的逻辑,然后对不同类型的证件选择性地调用不同的逻辑进行信息提取,所以一般在通用OCR识别之后,需要依靠一些后续逻辑以实现对证件的预定内容进行提取。
对不同类型证件选择性地调用对应的处理逻辑,涉及到对证件的分类,也即根据证件的类型调用该证件类型对应的处理逻辑处理该证件。如果没有预先定义输入图像属于什么类型证件,那么该如何去自动化的对证件进行分类以让服务知道应该选择哪个模型来对文件内容进行自动化提取呢?比如需要在一个服务中适应不同的证件类型,需要在进行后续逻辑之前,对证件进行分类处理,然后依据分类结果决定调用哪种逻辑来适应当前类型证件的定制化提取需求。尤其对于一些特征不明显、单从外形上难以区分的证件类型,例如A4纸打印的表格类证件等,有很多不同的证件都会具有相似的外观特点,用一般的物体识别模型来完成区分证件类型的任务会比较困难,也很难通过训练一般的物体识别模型从而对待分类的证件加以区分,这时仅通过一般的物体识别模型很难实现对证件进行准确分类。
发明内容
本申请实施例提供了一种证件图像分类方法、装置、计算机设备及计算机可读存储介质,能够解决传统技术中通过通用物体识别模型对证件图像进行分类时存在的分类准确性较低的问题。
第一方面,本申请实施例提供了一种证件图像分类方法,所述方法包括:获取待分类的证件图像;基于OCR模型提取所述证件图像中包含的所有字段;根据所述字段,通过第一预设方式生成所述证件图像的向量;判断预设的向量集中是否存在与所述证件图像的向量相匹配的向量,其中,所述向量集包括多个通过所述第一预设方式所生成的、对应于不同证件类型的证件图像的向量;若所述向量集中存在与所述证件图像的向量相匹配的向量,将与所述证件图像的向量相匹配的向量作为目标向量,并根据所述目标向量对应的证件类型确定所述证件图像的证件类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910979547.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序