[发明专利]一种图像的分类方法及装置有效
申请号: | 201810502083.2 | 申请日: | 2018-05-23 |
公开(公告)号: | CN110533018B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 戴威 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/764;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 装置 | ||
本发明提供了一种图像的分类方法和分类装置,所述方法首先确定待分类图像;然后将所述待分类图像的特征向量输入图像分类模型中;所述特征向量用于表征所述待分类图像的深度网络特征以及浅层文字特征;其中,所述图像分类模型为将待训练图像的深度网络特征以及浅层文字特征进行处理后得到的特征向量进行训练后得到的机器学习模型;最后获取所述图像分类模型输出的该待分类图像所属类型的分类结果。可见,本发明由人工分类转为机器自动识别分类,大大提高了处理效率,同时降低了人力成本。且本发明技术方案中的分类模型是依据图像的深度网络特征以及浅层文字特征处理后的特征向量进行训练后得到的,因此对于文档类图像的分类结果准确性更高。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种图像的分类方法及装置。
背景技术
由于企业管理的需要,企业通常会保存很多类型的图像,尤其例如手续、证明、证书等文档类图像。企业在收集到上述文档类图像后,需要对其进行分类,然后进行归档保存等后续处理。
现有技术中,均是由人工对各种类型的图像凭借经验进行分类识别从而得到该图像的类型,然后在进行归档等工作。
可见,对图像的分类识别工作十分繁重,而且人工处理的效率不高。对企业来说,也需要雇佣员工来执行相应工作,人工成本也很高,加大了企业的运营成本。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像的分类方法及装置,用于提高对图像分类的效率,降低企业运营成本。
为实现上述目的,本发明提供如下技术方案:
本发明公开了一种图像的分类方法,包括:
确定待分类图像;
将所述待分类图像的特征向量输入图像分类模型中;所述特征向量用于表征所述待分类图像的深度网络特征以及浅层文字特征;其中,所述图像分类模型为将待训练图像的深度网络特征以及浅层文字特征进行处理后得到的特征向量进行训练后得到的机器学习模型;
获取所述图像分类模型输出的该待分类图像所属类型的分类结果。
优选的,所述待分类图像为文档类分类图像。
优选的,所述将所述待分类图像的特征向量输入图像分类模型中包括:
获取所述待分类图像的深度网络特征向量、文字分布特征向量以及文字内容特征向量;
将所述深度网络特征向量、所述文字分布特征向量以及所述文字内容特征向量拼接成待分类图像的特征向量;
将所述待分类图像的特征向量输入到图像分类模型中。
优选的,所述获取所述待分类图像的深度网络特征向量、文字分布特征向量以及文字内容特征向量包括:
将所述待分类图像输入卷积神经网络,提取所述卷积神经网络输出的深度网络特征向量;
将所述待分类图像输入连通文本区域识别网络,依据所述连通文本区域识别网络输出的文本框的分布信息得到文字分布特征向量;其中,所述文本框的分布信息用于表征所述待分类图像中文字所在位置的文本框的位置信息;
将所述待分类图像输入深度神经网络中,提取所述待分类图像的标题区域的文字,依据所述标题区域中全部文字的词向量生成文字内容特征向量;
将所述深度网络特征向量、所述文字分布特征向量以及所述文字内容特征向量依次进行拼接,得到所述待训练图像的特征向量。
优选的,所述依据所述连通文本区域识别网络输出的文本框的分布信息得到文字分布特征向量包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810502083.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:鉴伪方法、装置、终端及存储介质
- 下一篇:车牌定位方法、装置及存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序