[发明专利]一种多模态单证分类方法、系统、计算机设备及存储介质在审
申请号: | 202310378465.X | 申请日: | 2023-04-07 |
公开(公告)号: | CN116434245A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 刘颖 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/148;G06V30/146;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 罗志铭 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多模态单证 分类 方法 系统 计算机 设备 存储 介质 | ||
本发明提供了一种多模态单证分类方法、系统和存储介质,应用于多模态单证分类系统,所述方法包括,对N个待分类单证图像进行粗分类,获得第一粗分类单证图像;提取所述第一粗分类单证图像进行文本检测,获得至少一个文本区域;将每一所述文本区域进行分割,获得至少一个文本图像块;将所述文本图像块输入预先训练的字段识别模型进行类别细分,获得细分标签;根据所述细分标签确定所述待分类单针图像的目标类别,获得目标分类单证图像,从而解决针对多类别的、少训练样本的分类问题比较难解决,提升了分类效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种多模态单证分类方法、系统、计算机设备及存储介质。
背景技术
在金融保险行业,因业务审批流程不同,会产生不同的业务单据证件,且在对其进行处理时,需要对其进行分类,在金融领域,存在很多难以分类的单独证明类文件,且同一类型之间还存在模板更替,或者多种模板样式的问题,不同类型之间的单证之间因非常相似导致难以区分,且上述难以分类的问题很难用大训练量进行解决,因为训练样本不足,所以目前针对图像分类问题可以使用粗粒度分类问题和细粒度分类的方法进行分类,但针对多类别的、少训练样本的分类问题比较难解决,因此,因此业务上需要一种可以精确区分不同单证的方案
发明内容
本发明的主要目的在于提供了一种多模态单证分类方法、系统和存储介质,旨在解决现有的大批量单证分类效率低下的技术问题。
为实现上述目的,本发明提供一种多模态单证分类方法,所述方法包括:
对N个待分类单证图像进行粗分类,获得第一粗分类单证图像;
提取所述第一粗分类单证图像进行文本检测,获得至少一个文本区域;
将每一所述文本区域进行分割,获得至少一个文本图像块;
将所述文本图像块输入预先训练的字段识别模型进行类别细分,获得细分标签;
根据所述细分标签确定所述待分类单针图像的目标类别,获得目标分类单证图像。
可选地,所述对N个待分类单证图像进行粗分类,获得第一粗分类单证图像,所述方法包括:
对所述待分类单证图像进行图像切割,获得至少一个待选定区域;
根据预设的抑制条件对所述待选定区域进行冗余去除,获得至少一个选定区域;
将所述选定区域输入至预先训练好的分类模型,获得所述选定区域的第一置信度,所述第一置信度用于确定所述待分类单证图像为所述粗分类中第一粗分类的概率;
提取满足预设条件的所述第一置信度对应的所述待分类单证图像,获得第一粗分类单证图像。
可选地,所述提取所述第一粗分类单证图像进行文本检测,获得至少一个文本区域,所述方法包括:
对所述第一粗分类单证图像进行特征提取,获得至少一个特征图像块;
根据所述特征图像块对所述第一分类单证图像进行旋转角度预测,获得调整角度;
根据所述调整角度对所述第一粗分类单证图像像进行角度调整;
对角度调整后的所述第一粗分类单证图像进行文字检测,获得至少一个包括文字的文本区域。
可选地,所述将每一所述文本区域进行分割,获得至少一个文本图像块,所述方法包括:
提取所述文本区域的浅层特征,获得文本浅层特征集;
根据所述文本浅层特征集对所述文本区域进行实例预测,获得至少一个文本实例;
根据所述文本区域的坐标对所述文本实例进行分割,获得至少一个文本图像块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310378465.X/2.html,转载请声明来源钻瓜专利网。