[发明专利]小样本视频分类和分类模型训练方法及其装置在审
申请号: | 202210557333.9 | 申请日: | 2022-05-20 |
公开(公告)号: | CN115019087A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 李扬曦;彭成维;刘科栋;缪亚男;王佩;胡卫明;李兵;刘雨帆;王坚;罗文阳 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院自动化研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/80;G06V10/77 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 董娜 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 视频 分类 模型 训练 方法 及其 装置 | ||
1.一种小样本视频分类方法,其特征在于,包括:
将小样本分类任务输入预先构建的收敛的压缩域长短时Cross-Transformer模型,获取压缩域信息;
基于所述压缩域信息,获取短时融合的帧特征;
基于所述短时融合的帧特征,获取查询特征,并输出基于所述查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,所述分类分数最大的支撑类别用于表示查询视频的分类结果。
2.根据权利要求1所述的小样本视频分类方法,其特征在于,所述将小样本分类任务输入预先构建的收敛的压缩域长短时Cross-Transformer模型,获取压缩域信息,包括:
基于小样本分类任务,获取预测帧重要性值和图像群组重要性值;
基于所述图像群组重要性值获取信息帧的RGB图像,且基于所述预测帧重要性值获取预测帧的运动向量;
基于预处理的所述信息帧的RGB图像和所述预测帧的运动向量,获取压缩域信息。
3.根据权利要求2所述的小样本视频分类方法,其特征在于,所述基于所述图像群组重要性值获取信息帧的RGB图像,且基于所述预测帧重要性值获取预测帧的运动向量,包括:
基于图像群组重要性值,获取阶段图像群组,其中,所述阶段图像群组包括训练图像群组和测试图像群组,所述训练图像群组是基于归一化的图像群组重要性值获取的图像群组的概率分布随机确定,所述测试图像群组是基于图像群组重要性值最高值确定;
解码所述阶段图像群组的信息帧的RGB图像;
基于所述阶段图像群组,获取阶段预测帧,其中,所述阶段预测帧包括训练预测帧和测试预测帧,训练预测帧是基于归一化的预测帧重要性值获取的预测帧的概率分布随机确定,所述测试预测帧是基于预测帧重要性值最高值确定;
解码所述阶段预测帧的预测帧的运动向量,基于预处理的信息帧的RGB图像和预测帧的运动向量的获取,确定压缩域信息。
4.根据权利要求1所述的小样本视频分类方法,其特征在于,所述基于所述压缩域信息,获取短时融合的帧特征,包括:基于所述压缩域信息,分别构建I分支和MV分支,且基于侧向连接的I分支和MV分支的短时交互,每个分支均输出短时融合的帧特征,其中,所述基于侧向连接的I分支和MV分支的短时交互发生于同一图像群组内。
5.根据权利要求1-4中任一项所述的小样本视频分类方法,其特征在于,所述基于所述短时融合的帧特征,获取查询特征,并输出基于所述查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,所述分类分数最大的支撑类别用于表示查询视频的分类结果,包括:
基于自注意力层对短时融合的帧特征的处理,获取长短时帧特征;
在长短时帧特征投影于查询类别原型所在特征空间的情况下,获取查询特征;
输出基于所述查询特征获取的查询视频对各个查询类别原型所属支撑类别的分类分数,其中,所述查询类别原型是基于互注意力层为查询视频和支撑类别分别构造的元组表示获得。
6.根据权利要求5所述的小样本视频分类方法,其特征在于,所述查询类别原型是基于互注意力层为查询视频和支撑类别分别构造的元组表示获得,包括:
基于多个所述长短时帧特征首尾拼接获取的向量,获取视频的n元组,其中,n表示超参数,且n为正整数;
基于查询视频的n元组集合,获取查询视频的n元组表示;
基于支撑类别下所有支撑视频的n元组集合,获取支撑类别的n元组表示。
7.一种小样本视频分类模型训练方法,其特征在于,包括:
构建压缩域长短时Cross-Transformer模型;
基于预先构建的小样本视频分类训练数据集,对所述压缩域长短时Cross-Transformer模型进行情节训练,获取收敛的压缩域长短时Cross-Transformer模型,其中,所述收敛的压缩域长短时Cross-Transformer模型执行如权利要求1-6中任一项所述的小样本视频分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院自动化研究所,未经国家计算机网络与信息安全管理中心;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210557333.9/1.html,转载请声明来源钻瓜专利网。