[发明专利]一种基于特征与多标签增强表示的短视频自动标注方法在审
申请号: | 202010383978.6 | 申请日: | 2020-05-08 |
公开(公告)号: | CN111723241A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 吕卫;李德盛;井佩光;苏育挺 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/75 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 标签 增强 表示 视频 自动 标注 方法 | ||
1.一种基于特征与多标签增强表示的短视频自动标注方法,其特征在于,所述方法包括:
利用字典映射矩阵、公共低秩表示的积和稀疏误差矩阵重构原始特征矩阵,从而整体构成多视角低秩表征项;
通过对整体数据集进行聚类,获取全部数据集以及不同聚类中潜在标签相关性信息,构成全局与局部标签相关性学习项;
将公共低秩表示作为预测标签,与真实标签相减得到标注误差并使其最小化,构成最小化标注误差项;
由多视角低秩表征项、全局与局部标签相关性学习项、最小化标注误差项进行加权获得总目标函数,利用交替方向乘子法优化总目标函数,引入拉格朗日乘子,依次迭代更新各个矩阵变量,直至目标函数的值收敛,进而得到最终的标注结果。
2.根据权利要求1所述的一种基于特征与多标签增强表示的短视频自动标注方法,其特征在于,所述多视角低秩表征项具体为:
s.t.Xi=DiL+Ei,i=1,2,...,V
其中,i为视角序号,为第i视角的特征矩阵,为第i视角的字典映射矩阵,L∈RC×N为多视角特征的公共低秩表示,为稀疏误差矩阵,R为实数集,di为第i视角的特征维度,V为视角总数,N为样本总数,C为标签类别总数,∑(·)为求和符号,||·||*为核范数,||·||1为l1范数,λ1和λ4为调节参数。
3.根据权利要求2所述的一种基于特征与多标签增强表示的短视频自动标注方法,其特征在于,所述全局与局部标签相关性学习项具体为:
s.t.BT=GL+EB
其中,k为聚类个数,v为聚类的类别序号,m和n为标签序号,G∈RC×C为标签相关性矩阵,Gm,n为第m个标签与第n个标签之间的相关性,B∈RN×C为短视频的真实标签矩阵,EB∈RC×N为标签误差矩阵,||·||2为2范数,λ3为调节参数,为真实标签矩阵中第v聚类中第m个标签所构成的向量,为真实标签矩阵中第v聚类中第n个标签所构成的向量,λ2为调节参数。
4.根据权利要求3所述的一种基于特征与多标签增强表示的短视频自动标注方法,其特征在于,所述最小化标注误差项具体为:
其中,T表示矩阵的转置,||·||F代表矩阵的F范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010383978.6/1.html,转载请声明来源钻瓜专利网。