[发明专利]一种基于三维卷积神经网络的视频分类方法在审

申请号：	201510380973.7	申请日：	2015-06-30
公开（公告）号：	CN104966104A	公开（公告）日：	2015-10-07
发明（设计）人：	李静	申请（专利权）人：	山东管理学院
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	济南瑞宸知识产权代理有限公司 37268	代理人：	徐健
地址：	250100 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于三维卷积神经网络的视频分类的方法，属于视频处理技术领域。此方法将视频等间隔采样为多个视频段，扩增了视频数据库，将三维视频段直接输入到3D CNN中，同时提取视频的时域和空域特征，改善了传统视频分类方法因人工选取视频特征及视频建模方式的局限性。并行分布式3D CNN多分类模型降低了3D CNN学习的复杂度，同时使得分类系统更方便的实现分布式并行计算。基于3D CNN多分类系统能够仅用较少的视频段就达到较高的识别率，并能够将不属于任意类别的视频分类为新增类别，避免了对新增类别的分类错误。
搜索关键词：	一种基于三维卷积神经网络视频分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于三维卷积神经网络3D CNN的视频分类方法，其特征在于，该方法构建了并行分布式的三维卷积神经网络多分类模型，并对视频库进行扩增处理，该方法包括以下步骤：(1)读取视频库中的视频，对视频帧进行灰度化处理；(2)通过等间隔采样，对已有视频库进行扩增处理，使原有视频库的每个视频扩增为多个固定帧数为k的视频段，且任意视频段均无重复的帧；(3)对经过扩增处理的视频库，按照原有的类别标签信息，对每一类视频，将由该类视频经等间隔采样得到的视频段作为该类正样本，其他类视频的视频段作为负样本，制作其训练测试数据集；(4)构建C个3D CNN网络，C是数据集中的类别数，每个3D CNN以视频段作为输入，用于实现对某一类视频的二分类识别，只有两个输出节点，利用每一类视频的训练数据集训练属于该类的3D CNN，使C个3D CNN网络分别能够对C类视频进行是否属于该类的二分类识别；(5)构建并行分布式3D CNN多分类模型，将C个训练好的3D CNN进行并联，在并联末端设置分类机制，通过比较C个3D CNN对输入视频的视频段的分类效果将该输入视频分类；(6)待分类视频只需随机输入其部分视频段到此多分类网络模型中，即可判断其类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东管理学院，未经山东管理学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510380973.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于三维卷积神经网络的视频分类方法在审

专利文献下载