[发明专利]一种图像分类方法、装置、终端设备和存储介质有效
申请号: | 201811269756.0 | 申请日: | 2018-10-29 |
公开(公告)号: | CN109522942B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 乔宇;庄培钦;王亚立 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及图像处理技术领域,提出一种图像分类方法、装置、终端设备和计算机存储介质。在获取待分类图像之后,将该待分类图像输入预先构建的卷积神经网络模型,得到该待分类图像的图像特征;然后从预设的文本库中选取与该待分类图像对应的目标文本,将该目标文本转换为词向量,输入预先构建的循环神经网络模型,得到该目标文本的文本特征;接着结合该文本特征对该图像特征进行加权叠加处理,得到加权图像特征;最后采用双线性乘法融合该加权图像特征和该文本特征,利用融合后的特征完成两类分类,得到该待分类图像的图像类别。采用本发明能够解决高细粒度图像分类的问题。 | ||
搜索关键词: | 一种 图像 分类 方法 装置 终端设备 存储 介质 | ||
【主权项】:
1.一种图像分类方法,其特征在于,包括:获取待分类图像,所述待分类图像的图像类别属于预设的多对图像类别组合中的一种,每对所述图像类别组合分别包含图像特征的差别小于预设阈值的两种图像类别,每对所述图像类别组合分别和预设的文本库中的一个文本关联,所述文本用于描述关联的图像类别组合中的两种图像类别之间的差异;将所述待分类图像输入预先构建的卷积神经网络模型,得到所述待分类图像的图像特征,所述卷积神经网络模型由所述多对图像类别组合的样本图像训练完成;从所述文本库中选取与所述待分类图像对应的目标文本;将所述目标文本转换为词向量,输入预先构建的循环神经网络模型,得到所述目标文本的文本特征,所述循环神经网络模型由所述多对图像类别组合的样本图像以及所述文本库中的文本训练完成;结合所述文本特征对所述图像特征进行加权叠加处理,得到加权图像特征;采用双线性乘法融合所述加权图像特征和所述文本特征;利用融合后的特征完成两类分类,得到所述待分类图像的图像类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811269756.0/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序