[发明专利]视频分类方法、电子设备和存储介质在审
申请号: | 202010754189.9 | 申请日: | 2020-07-30 |
公开(公告)号: | CN112101091A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 周晓晓;李琳;周冰;陆彦良;李东晓 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 电子设备 存储 介质 | ||
1.一种视频分类方法,其特征在于,包括:
根据目标视频的组成元素确定各组成元素对应的特征信息,所述组成元素包括图像,声音,和/或字幕;
将各组成元素对应的特征信息输入视频分类模型中,得到由所述视频分类模型输出的分类信息,所述分类信息用于表征所述目标视频的类别;
其中,所述视频分类模型为将根据样本视频确定的特征信息和所述样本视频的类别标签作为输入,通过机器学习训练得到的,用于对视频进行分类的模型;
所述视频分类模型包括升维层和聚类运算层,所述升维层用于对所述特征信息进行升维处理,所述聚类运算层用于根据作为训练参数的聚类中心矩阵和升维后的所述特征信息进行运算。
2.根据权利要求1所述的视频分类方法,其特征在于,所述将各组成元素对应的特征信息输入视频分类模型中,得到由所述视频分类模型输出的分类信息,包括:
将各组成元素的所述特征信息输入到所述升维层,由所述升维层输出升维后的特征信息;
将升维后的所述特征信息输入到所述聚类运算层,由所述聚类运算层输出第一矩阵;
将所述第一矩阵输入到所述视频分类模型的权重聚合层,由所述权重聚合层输出第二矩阵;
将所述第二矩阵输入到所述视频分类模型的分类层,由所述分类层输出所述分类信息;
其中,所述权重聚合层包括至少一个卷积子层和至少一个激活函数,所述分类信息包括所述目标视频的多个类别标签。
3.根据权利要求2所述的视频分类方法,其特征在于,所述聚类运算层包括多个聚类子层,所述聚类子层的个数与视频的组成元素的个数相同,相应地,所述将升维后的所述特征信息输入到所述聚类运算层,由所述聚类运算层输出第一矩阵,包括:
将升维后的各组成元素对应的特征信息分别输入到对应的聚类子层,由各聚类子层输出各组成元素对应的聚类运算矩阵;
将各组成元素对应的聚类运算矩阵进行拼接,得到所述第一矩阵;
其中,所述聚类子层用于根据所述特征信息和属于所述聚类子层的聚类中心矩阵和初始权重矩阵进行运算。
4.根据权利要求3所述的视频分类方法,其特征在于,所述聚类子层包括第一运算单元、第二运算单元和聚类单元,相应地,所述将升维后的各组成元素对应的特征信息分别输入到对应的聚类子层,由各聚类子层输出各组成元素对应的聚类运算矩阵,包括:
将升维后的任一组成元素对应的特征信息输入到对应的第一运算单元,由所述第一运算单元根据所述特征信息和初始权重矩阵确定第一运算矩阵;
将所述的升维后的任一组成元素对应的特征信息输入到对应的第二运算单元,由所述第二运算单元根据所述特征信息、所述初始权重矩阵和聚类中心矩阵确定第二运算矩阵;
将所述第一运算矩阵和所述第二运算矩阵输入到对应的聚类单元,由所述聚类单元根据第一运算矩阵和所述第二运算矩阵确定聚类运算矩阵。
5.根据权利要求4所述的视频分类方法,其特征在于,升维后的任一组成元素对应的特征信息为升维矩阵,相应地,所述将升维后的任一组成元素对应的特征信息输入到对应的第一运算单元,由所述第一运算单元根据所述特征信息和初始权重矩阵确定第一运算矩阵,包括:
将升维矩阵输入到第一运算单元,由所述第一运算单元进行以下处理:
将所述升维矩阵进行变换,得到第一变换矩阵;将所述升维矩阵采用激活函数激活,得到第一权重矩阵;将所述升维矩阵和初始权重矩阵进行相乘,得到第二权重矩阵;将所述第一权重矩阵和所述第二权重矩阵进行每行向量逐点相乘,得到第三权重矩阵;将所述第一变换矩阵和所述第三权重矩阵进行相乘,得到第一运算矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010754189.9/1.html,转载请声明来源钻瓜专利网。