[发明专利]影片年代类型识别的系统、方法及识别模型的构建方法有效
申请号: | 202010580262.5 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111797912B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 杨唤晨;徐杰;谢恩鹏;刘永辉 | 申请(专利权)人: | 山东浪潮超高清视频产业有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06V10/774;G06V10/32;G06V10/56 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 刘德 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 影片 年代 类型 识别 系统 方法 模型 构建 | ||
本发明提供了一种影片年代类型识别的系统、方法及识别模型的构建方法。一种影片年代类型识别的系统,包括:训练好的影片年代类型识别模型;计算设备、存储设备和输入输出设备构成用于自动识别过程的计算机设备;数字影片解码、截图和图片预处理构成的卷积神经网络系统;能够根据模型推理结果分析影片年代类型的分类器。通过该系统和方法,计算设备从存储设备获得数字影片后可自动识别影片的年代类型。相比人工识别,使用计算设备识别具有可靠、快速、廉价和可批量处理等诸多优势。
技术领域
本发明涉及一种影片年代类型识别的系统、方法及识别模型的构建方法,属于信息技术技术领域。
背景技术
近年来,视频业务发展迅速,追网剧、看数字电视等活动成为人们的重要娱乐方式。视频服务商往往储存有大量的影片,如何自动、快速、可靠、批量地给这些影片打上年代、题材、体裁等标签,对于帮助服务商提供优质的视频服务具有重要意义。
发明内容
本发明目的是提供了一种影片年代类型识别的系统、方法及识别模型的构建方法。
本发明为实现上述目的,通过以下技术方案实现:
一种影片年代类型识别的系统,包括:
训练好的影片年代类型识别模型;
计算设备、存储设备和输入输出设备构成用于自动识别过程的计算机设备;
数字影片解码、截图和图片预处理构成的卷积神经网络系统;
能够根据模型推理结果分析影片年代类型的分类器。
上述影片年代类型识别的系统基础上,卷积神经网络系统为VGG-16网络结构。
一种所述的系统进行影片年代类型识别方法,包括如下步骤:
计算设备从存储设备读取待识别的影片,将影片的开头a分钟和结尾b分钟掐去后,均匀时间间隔地截取M张图片;
将M张图片进行预处理之后,分别输入至卷积神经网络;
对于每一个图片输入,卷积神经网络会推理出一个N维概率向量,每一维都对应图片属于相应年代类型的概率;
M张图片全部推理完成后,影片年代类型识别的系统将M个概率向量输入至分类器。
一种所述影片年代类型识别模型的构建方法,其特征在于,包括如下步骤:
S1. 构建训练集和验证集:准备分属于N种年代类型的大量的数字影片,从每个影片时间间隔均匀地截取图片,作为该类型的训练数据和验证数据;
S2. 卷积神经网络的搭建:使用一种用于图像分类任务的深层卷积网络作为本网络的主体;
S3. 卷积神经网络的训练:冻结卷积基的参数,训练分类器,分类器的第一层使用Dropout;经多轮训练,分类器达到较好的正确率后,解冻卷积基的底层,进行微调训练,并验证集上验证网络的正确率。
上述所述影片年代类型识别模型的构建方法,所有的训练图片和验证图片应进行预处理,包括如下步骤:1)缩放至神经网络要求的输入尺寸;2)每张图片的像素减去整个图片数据集的平均的RGB值;3)将RGB的像素值除以255,使得RGB数值介于0到1。
6.根据权利要求3所述影片年代类型识别模型的构建方法,其特征在于:分类器按照下述算法分析出影片的年代类型:视频流的任一播放时刻t都对应一个帧,将该帧作为模型的输入可得到一个N维概率向量 ,向量的每个维度分别对应一个年代类型;
引入评分函数,其中 ;
将所有播放时刻的评分函数做积分,得到总评分 ,总评分是一个N维向量,其各个维的定义式为 ,且每一维都对应一个年代类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮超高清视频产业有限公司,未经山东浪潮超高清视频产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010580262.5/2.html,转载请声明来源钻瓜专利网。