[发明专利]多模态特征的融合方法以及装置在审
申请号: | 201310252672.7 | 申请日: | 2013-06-24 |
公开(公告)号: | CN104239360A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 刘曦;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 陶海萍 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多模态 特征 融合 方法 以及 装置 | ||
1.一种多模态特征的融合方法,所述融合方法包括:
利用训练图像以及图像的多模态特征,为查询图像生成多组关于多个类的第一分类分数,并获得所述第一分类分数对应的多个两两关系矩阵;
融合所述多个两两关系矩阵以得到组合后的关系矩阵;
根据组合后的关系矩阵计算最终的关于所述多个类的分类分数,并为所述查询图像选择具有较大分类分数的一个或多个类。
2.根据权利要求1所述的融合方法,其中,所述融合方法还包括:
将所有的多模态特征直接拼接成一组合特征;
利用训练图像以及所述组合特征,为所述查询图像生成一组关于所述多个类的第二分类分数,并获得所述第二分类分数对应的一个两两关系矩阵;
并且,将所述第一分类分数对应的多个两两关系矩阵以及所述第二分类分数对应的一个两两关系矩阵进行融合以得到组合后的关系矩阵。
3.根据权利要求2所述的融合方法,其中,融合所述多个两两关系矩阵以得到组合后的关系矩阵具体包括:
对所述第一分类分数对应的多个两两关系矩阵进行线性组合;并且将所述第二分类分数对应的两两关系矩阵作为约束项以引导所述线性组合。
4.根据权利要求3所述的融合方法,其中,所述线性组合获得的关系矩阵为:Tc=∑i=1,...,MwiTi,其中Ti为所述第一分类分数对应的两两关系矩阵,i=1,...,M,M为所述多模态特征的个数;wi为线性权重,所述线性权重满足如下条件:
条件1:所有线性权重均大于或者等于零;
条件2:线性权重的L2-范数最小;
条件3:线性组合中的Tc和Ta尽可能接近,所述Ta为所述第二分类分数对应的两两关系矩阵。
5.根据权利要求1至4任一项所述的融合方法,其中,在融合所述多个两两关系矩阵以得到组合后的关系矩阵之后,所述融合方法还包括:
对所述组合后的关系矩阵进行过滤或变换以获得最终的关系矩阵;
并且,根据所述最终的关系矩阵计算最终的关于所述多个类的分类分数。
6.根据权利要求5所述的融合方法,其中,对所述组合后的关系矩阵进行过滤或变换以获得最终的关系矩阵具体包括:
找出并保留所述组合后的关系矩阵Tc中最可信的元素;以及
根据最可信的元素获得最终的关系矩阵Tf;
其中,对于Tc中任意第(j,k)个元素,如果满足以下其中任一个条件,则该元素被认为是可信的:
条件1:Tc(j,k)>0,并且在M个关系矩阵Ti中有Nt个关系矩阵的第(j,k)个元素大于0;
条件2:Tc(j,k)<0,并且在M个关系矩阵Ti中有Nt个矩阵的第(j,k)个元素小于0;
其中,Nt大于一预设值;Ti为所述第一分类分数对应的两两关系矩阵,i=1,...,M。
7.根据权利要求6所述的融合方法,其中,根据最可信的元素获得最终的关系矩阵Tf,具体满足如下条件:
条件1:所述关系矩阵Tf的秩尽可能小;
条件2:所述关系矩阵Tf的大小与所述关系矩阵Tc相同、且所述关系矩阵Tf是反对称的;
条件3:所找到的最可信元素在Tc中的索引位置所对应的Tf中的元素,与所述最可信元素尽可能接近。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310252672.7/1.html,转载请声明来源钻瓜专利网。