[发明专利]一种基于跨模态的快速多标签图像分类方法和系统在审
申请号: | 202011100158.8 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112199536A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 刘渝;汪洋涛;谢延昭;李春花;王冲;牛中盈;周可 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/58;G06K9/62 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于跨模态的快速多标签图像分类方法,该方法可以挖掘图像中不同对象之间的共现关系,进而高效地融合图像特征与标签共现关系来生成一个端到端的多标签图像分类模型。该方法通过统计标签之间的共现概率来模型对象之间的依赖关系,并采用双线性多模态因子池化组件来融合图像特征与标签共现关系,不仅加速了模型的收敛速度而且提升了图像分类性能。本发明提出的方法首先结合卷积神经网络和图卷积网络分别生成图像的特征和标签的共现关系词向量,然后采用MFB融合这两种模态的向量,最后通过多标签分类函数生成端到端的分类模型。本发明高效地融合了图像的特征和标签的共现关系词向量,大大加速了模型的收敛速度。 | ||
搜索关键词: | 一种 基于 跨模态 快速 标签 图像 分类 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011100158.8/,转载请声明来源钻瓜专利网。