[发明专利]发票分类方法、装置、计算机设备和存储介质在审
申请号: | 202110987139.X | 申请日: | 2021-08-26 |
公开(公告)号: | CN113780116A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 丁拥科 | 申请(专利权)人: | 众安在线财产保险股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06Q30/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200001 上海市黄*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发票 分类 方法 装置 计算机 设备 存储 介质 | ||
1.一种发票分类方法,其特征在于,所述方法包括:
获取待处理发票图片;
对所述待处理发票图片进行图像码识别;
当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
根据所述分类字符对所述待处理发票图片进行分类。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符,包括:
对所述待处理发票图片进行分割以得到表头区域;
识别所述表头区域中的分类字符。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,所述表头检测模型的训练方式包括:
读取第一发票图像,并标记所述第一发票图像中表头位置;
根据所述第一发票图像和对应的所述表头位置进行训练得到表头检测模型。
4.根据权利要求2所述的方法,其特征在于,所述识别所述表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,所述文字识别模型的训练方式包括:
随机生成不同长度的文本切片,并标记所述文本切片的文本内容;
根据所述不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述分类字符对所述待处理发票图片进行分类,包括:
获取所述分类字符所对应的发票分类作为所述待处理发票图片的分类。
6.根据权利要求1所述的方法,其特征在于,所述对所述待处理发票图片进行图像码识别是通过预先训练的图像码检测模型得到的;其中,所述图像码检测模型的训练方式包括:
读取第二发票图像,并根据所述第二发票图像是否含有图像码生成目标标记;
根据所述第二发票图像和所述目标标记进行模型训练得到图像码检测模型。
7.一种发票分类装置,其特征在于,所述装置包括:
接收模块,用于获取待处理发票图片;
图像码检测模块,用于判断待处理发票图片中是否含有图像码;
分类字符识别模块,用于当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
分类模块,用于根据所述分类字符对所述待处理发票图片进行分类。
8.根据权利要求7所述的装置,其特征在于,所述分类字符识别模块包括:
表头检测单元,用于对所述待处理发票图片进行分割以得到表头区域待;
文字识别单元,用于识别所述表头区域中的分类字符。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安在线财产保险股份有限公司,未经众安在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110987139.X/1.html,转载请声明来源钻瓜专利网。