[发明专利]票据自动分类训练方法、装置及自动分类方法、装置在审
申请号: | 201811406818.8 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109271977A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 梁欢 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动分类 票据 特征信息 分类 获取模块 标注 图像处理技术 基于机器 票面图像 视觉技术 提取模块 训练模块 训练装置 噪声污染 图片 分类库 标签 归属 | ||
本发明涉及图像处理技术,其公开了一种票据自动分类训练方法、装置及自动分类方法、装置,解决传统技术中基于机器视觉技术的分类方案在票面图像质量较差,有噪声污染时无法准确分类的问题。本发明中的票据自动分类训练装置,其包括:第一获取模块,用于获取训练票据图片的归属分类库标签,并提取所述训练票据图片的第一特征信息;第二获取模块,用于获取与训练票据图片的类别对应的第一分类标注数据;第一提取模块,用于提取所述训练票据图片的第二特征信息;训练模块,用于根据所述第一特征信息、第二特征信息和第一分类标注数据进行训练,以生成自动分类模型。
技术领域
本发明涉及图像处理技术,具体涉及一种票据自动分类训练方法、装置及自动分类方法、装置。
背景技术
在需要财务费用报账,寿险理赔等操作中,在对批量上传的票据图片进行集中业务处理前,往往需要预先对发票图片进行分类,再做集中业务处理,如发票核算,票面信息录入等。
现有技术中,基于机器视觉技术的分类方案通常使用手工设计出的特征,如LBP(局部二值模式)等作为下一步分类操作的输入,该方案在图像质量好时分类效果好。然而,在现实中,由于不可避免的因素,图片质量好的票据数量占比较低,仅仅使用这些手工设计的特征作为分类的前一步输入就显示出了弊端,直接带来的影响就是在票面图像质量较差,有噪声污染时无法准确分类。
发明内容
本发明所要解决的技术问题是:提出一种票据自动分类训练方法、装置及自动分类方法、装置,解决传统技术中基于机器视觉技术的分类方案在票面图像质量较差,有噪声污染时无法准确分类的问题。
本发明解决上述技术问题所采用的技术方案是:
第一方面,本发明提出了一种票据自动分类训练装置,其包括:
第一获取模块,用于获取训练票据图片的归属分类库标签,并提取所述训练票据图片的第一特征信息;
第二获取模块,用于获取与训练票据图片的类别对应的第一分类标注数据;
第一提取模块,用于提取所述训练票据图片的第二特征信息;
训练模块,用于根据所述第一特征信息、第二特征信息和第一分类标注数据进行训练,以生成自动分类模型。
作为进一步优化,该自动分类训练装置还包括:
第三获取模块,用于获取测试票据图片,并提取所述测试票据图片的第三特征信息;
第四获取模块,用于获取与所述测试票据图片类别对应的第二分类标注数据;
第二提取模块,用于提取所述测试票据图片的第四特征信息;
第一生成模块,用于将所述第三特征信息和所述第四特征信息输入至所述自动分类模型,以通过所述自动分类模型生成所述测试票据图片的分类结果;
计算模块,用于根据所述测试票据图片的分类结果和第二分类标注数据计算所述自动分类模型分类的准确度;
判断模块,用于判断所述自动分类模型分类的准确度是否超过预设阈值;
第一处理模块,用于在判断所述自动分类模型分类的准确度未超过预设阈值时,重新训练所述自动分类模型,直至所述模型分类的准确度超过预设阈值。
第二方面,基于上述票据自动分类训练装置,本发明还提供了一种票据自动分类训练方法,包括以下步骤:
a.获取训练图片的归属分类库标签,并提取所述训练图片的第一特征信息;
b.获取与训练图片的类别对应的第一分类标注数据;
c.提取训练图片的第二特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811406818.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于语音图像双模态果蔬农产品智能识别装置
- 下一篇:人脸识别防欺骗方法