[发明专利]一种视频运镜的识别方法及系统有效

申请号：	202110413792.5	申请日：	2021-04-16
公开（公告）号：	CN113177445B	公开（公告）日：	2022-07-12
发明（设计）人：	刘辉	申请（专利权）人：	新华智云科技有限公司
主分类号：	G06V20/40	分类号：	G06V20/40;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	杭州裕阳联合专利代理有限公司 33289	代理人：	田金霞
地址：	310012 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种视频运镜的识别方法及系统，方法包括：获取训练数据集，训练数据集包括至少一个视频流和每个视频流对应的第一运镜类别；对训练数据集的每个视频流进行运镜转换，以将每个视频流的第一运镜类别转换为第二运镜类别；获取运镜转换前、后的训练数据集的每个视频流的第一图像输入序列；将每个视频流的第一图像输入序列输入到第一神经网络、第二神经网络和第三神经网络中，得到预测运镜类别；将同一视频流对应的预测运镜类别与第一运镜类别或第二运镜类别进行比对，以得到比对结果，根据比对结果采用预设算法更新第二神经网络和第三神经网络的参数；获取待识别视频流的识别运镜类别。有益效果：提高运镜类别的识别精确度。

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种视频运镜的识别方法及系统。

背景技术

视频剪辑在视频制作中具有重要的作用，在视频剪辑过程中，使用不同的运镜类别可以呈现不同的效果，传递出不同的情感。

然而目前通常采用人工的方式识别运镜类别，即通过人工观看视频，来对视频的运镜类别进行识别，不仅需要消耗大量人力成本和时间成本，而且采用需要识别人员具有专业的摄影知识，人工标记成本高；

目前也可以常采用编撰规则的方式进行识别，即将根据预先设置的运镜类别的特征规则来识别视频的运镜类别，然而上述现有技术中的特征规则需要人员输入，并且每条特征规则的适用范围小，每条特征规则的识别准确率较低，多条特征规则之间容易出现冲突，从而导致视频中的每个片段符合多特征规则，进而导致特征规则的更新成本高。

发明内容

针对现有技术中存在的上述问题，现提供一种视频运镜的识别方法及系统，实现了对视频的运镜类别进行识别。

具体技术方案如下：

一种视频运镜的识别方法，其中，方法包括：

获取训练数据集，训练数据集包括至少一个视频流和每个视频流对应的第一运镜类别；

对训练数据集的每个视频流进行运镜转换，以将每个视频流的第一运镜类别转换为第二运镜类别；

其中，第一运镜类别与第二运镜类别不同；

获取运镜转换前、后的训练数据集的每个视频流的第一图像输入序列；

将每个视频流的第一图像输入序列输入到第一神经网络、第二神经网络和第三神经网络中，得到预测运镜类别；

将同一视频流对应的预测运镜类别与第一运镜类别或第二运镜类别进行比对，以得到比对结果，根据比对结果采用预设算法更新第二神经网络和第三神经网络的参数；

获取待识别视频流的第二图像输入序列，并依次输入到第一神经网络，以及进行参数调整后的第二神经网络和第三神经网络中，获得识别运镜类别。

优选的，视频运镜的识别方法，其中，对训练数据集的每个视频流进行运镜转换，以将每个视频流的第一运镜类别转换为第二运镜类别，具体包括以下步骤：