[发明专利]影片年代类型识别的系统、方法及识别模型的构建方法有效
申请号: | 202010580262.5 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111797912B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 杨唤晨;徐杰;谢恩鹏;刘永辉 | 申请(专利权)人: | 山东浪潮超高清视频产业有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06V10/774;G06V10/32;G06V10/56 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 刘德 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 影片 年代 类型 识别 系统 方法 模型 构建 | ||
1.一种影片年代类型识别方法,其特征在于,包括一种影片年代类型识别系统,所述系统包括:
计算设备、存储设备和输入输出设备构成用于自动识别过程的计算机设备;
数字影片解码、截图、图片预处理和训练好的影片年代类型识别模型构成的卷积神经网络系统;识别模型为VGG-16网络结构;
能够根据模型推理结果分析影片年代类型的分类器;
所述方法包括如下步骤:
计算设备从存储设备读取待识别的影片,将影片的开头a分钟和结尾b分钟掐去后,均匀时间间隔地截取M张图片;
将M张图片进行预处理之后,分别输入至卷积神经网络;
对于每一个图片输入,卷积神经网络会推理出一个N维概率向量,每一维都对应图片属于相应年代类型的概率;
M张图片全部推理完成后,影片年代类型识别的系统将M个概率向量输入至分类器;
分类器按照下述算法分析出影片的年代类型:视频流的任一播放时刻t都对应一个帧,将该帧作为模型的输入可得到一个N维概率向量,向量的每个维度分别对应一个年代类型,引入评分函数,其中,将所有播放时刻的评分函数做积分,得到总评分,总评分是一个N维向量,其各个维的定义式为
且每一维都对应一个年代类型,取总评分最大的年代类型作为该视频的分类结果。
2.根据权利要求1所述的影片年代类型识别方法,其特征在于,包括如下步骤:
S1.构建训练集和验证集:准备分属于N种年代类型的大量的数字影片,从每个影片时间间隔均匀地截取图片,作为该类型的训练数据和验证数据;
S2.卷积神经网络的搭建:使用一种用于图像分类任务的深层卷积网络作为本网络的主体;
S3.卷积神经网络的训练:冻结卷积基的参数,训练分类器,分类器的第一层使用Dropout;经多轮训练,分类器达到较好的正确率后,解冻卷积基的底层,进行微调训练,并验证集上验证网络的正确率。
3.根据权利要求2所述的影片年代类型识别方法,其特征在于:将M张图片进行预处理包括如下步骤:1)缩放至神经网络要求的输入尺寸;2)每张图片的像素减去整个图片数据集的平均的RGB值;3)将RGB的像素值除以255,使得RGB数值介于0到1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮超高清视频产业有限公司,未经山东浪潮超高清视频产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010580262.5/1.html,转载请声明来源钻瓜专利网。