[发明专利]基于空域分类网络和时域分类网络融合的视频分类方法有效
申请号: | 201810475657.1 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108764084B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 韩冰;褚福跃;王平;高新波;连慧芳;张萌 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于空域分类网络和时域分类网络融合的视频分类方法,主要解决现有视频分类方法准确率低的问题。其实现方案为1)获取训练集和测试视频;2)从训练集中提取视频帧;3)使用训练集对卷积神经网络进行训练;4)对从训练集中提取的视频帧提取特征;5)使用训练集对空域分类网络进行训练;6)使用训练集对时域分类网络进行训练;7)使用训练后的空域分类网络和时域分类网络对测试视频进行分类,并对空域分类网络和时域分类网络的分类结果进行融合,完成对视频的分类。本发明相比现有视频分类方法有效提高了分类准确率,可用于视频的特征提取和识别。 | ||
搜索关键词: | 基于 空域 分类 网络 时域 融合 视频 方法 | ||
【主权项】:
1.基于空域分类网络和时域分类网络融合的视频分类方法,包括:1)获取训练集和测试视频:从已标记类别的视频数据库中任取N个视频组成训练集:X={x1,x2,...,xk,...,xN},其中xk是第k个训练集视频,xk的标签为yk,k=1,2,...,N;将剩余视频组成测试集,从测试集中取一个视频作为测试视频xtest;2)提取训练集X中训练集视频xk的全部视频帧其中,τ=1,2,...,T,T为视频xk中所包含视频帧的数目,以训练集视频xk的标签yk作为全部视频帧的标签;3)以全部视频帧及其标签yk作为训练数据,对卷积神经网络进行训练,得到训练好的卷积神经网络Z;4)提取全部视频帧的特征:4a)计算全部视频帧的视觉注意力特征4b)使用步骤3)训练好的卷积神经网络Z对视觉注意力特征进行提取,得到空域特征矩阵4c)使用步骤3)训练好的卷积神经网络Z对全部视频帧进行特征提取,得到时域特征矩阵5)利用空域特征矩阵对空域分类网络进行训练;6)利用时域特征矩阵对时域分类网络进行训练;7)使用训练后的空域分类网络和时域分类网络对测试视频xtest进行分类:7a)使用步骤5)训练后的空域分类网络计算空域分类网络上测试视频xtest属于不同视频类别的概率:ps={ps(1),ps(2),...,ps(m),...ps(M)},其中ps(m)是空域分类网络上测试视频xtest属于第m类视频的概率,m=1,2,...,M,M为视频类别数;7b)使用步骤6)训练后的时域分类网络计算时域分类网络上测试视频xtest属于不同视频类别的概率:pt={pt(1),pt(2),...,pt(m),...,pt(M)},其中pt(m)是时域分类网络上测试视频xtest属于第m类视频的概率;7c)根据7a)和7b)的结果,计算测试视频xtest属于第m类视频的概率:p(m)=wps(m)+(1‑w)pt(m),其中w是空域分类网络的分类结果所占的权重;7d)将p(m)中最大值所对应的视频类别,作为测试视频xtest的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810475657.1/,转载请声明来源钻瓜专利网。