[发明专利]一种基于三维卷积神经网络的视频分类方法在审

专利信息
申请号: 201510380973.7 申请日: 2015-06-30
公开(公告)号: CN104966104A 公开(公告)日: 2015-10-07
发明(设计)人: 李静 申请(专利权)人: 山东管理学院
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 济南瑞宸知识产权代理有限公司 37268 代理人: 徐健
地址: 250100 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 三维 卷积 神经网络 视频 分类 方法
【权利要求书】:

1.一种基于三维卷积神经网络3D CNN的视频分类方法,其特征在于,该方法构建了并行分布式的三维卷积神经网络多分类模型,并对视频库进行扩增处理,该方法包括以下步骤:

(1)读取视频库中的视频,对视频帧进行灰度化处理;

(2)通过等间隔采样,对已有视频库进行扩增处理,使原有视频库的每个视频扩增为多个固定帧数为k的视频段,且任意视频段均无重复的帧;

(3)对经过扩增处理的视频库,按照原有的类别标签信息,对每一类视频,将由该类视频经等间隔采样得到的视频段作为该类正样本,其他类视频的视频段作为负样本,制作其训练测试数据集;

(4)构建C个3D CNN网络,C是数据集中的类别数,每个3D CNN以视频段作为输入,用于实现对某一类视频的二分类识别,只有两个输出节点,利用每一类视频的训练数据集训练属于该类的3D CNN,使C个3D CNN网络分别能够对C类视频进行是否属于该类的二分类识别;

(5)构建并行分布式3D CNN多分类模型,将C个训练好的3D CNN进行并联,在并联末端设置分类机制,通过比较C个3D CNN对输入视频的视频段的分类效果将该输入视频分类;

(6)待分类视频只需随机输入其部分视频段到此多分类网络模型中,即可判断其类别。

2.根据权利要求1所述的基于三维卷积神经网络3D CNN的视频分类方法,其特征在于,步骤(2)中视频段的分段方法为等间隔采样,设视频段的帧数固定为k,分段方法如下:

设视频所有帧为F1,F2,…,Fn,则分成的视频段数为m=floor(n,k),其中floor函数为向下取整,分成的视频段为:

视频段1:F1,F1+m,F1+2m,…,F1+(k-1)×m

视频段2:F2,F2+m,F2+2m,…,F2+(k-1)×m

视频段m:Fm,F2m,F3m,…,Fk×m

3.根据权利要求1所述的基于三维卷积神经网络3D CNN的视频分类方法,其特征在于,步骤(3)中针对每一类视频的训练测试数据集的制作方法为:

设视频库中视频的类别总数为C,则第a类视频的训练正样本为属于第a类视频的视频段,训练负样本为不属于第a类视频的视频段,样本标签为{1,0},其中1表示属于第a类,0表示不属于第a类;每一类的测试样本是相同的,分为三种:属于该类的视频段、不属于该类而属于其他类的视频段、不属于任意类的视频段。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东管理学院,未经山东管理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510380973.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top