[发明专利]一种视频剪辑方法、视频聚合方法、装置以及系统在审
申请号: | 201811505962.7 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109684511A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 赵之健;林亦宁;包怡欣 | 申请(专利权)人: | 上海七牛信息技术有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 201203 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频剪辑 视频事件 视频 时间对齐 视频文本 预设 聚合 技术结合 视频分类 文本分类 剪辑 通用 分析 学习 | ||
本发明公开了一种视频剪辑方法、视频聚合方法、装置以及系统,该方法包括:分析视频文本信息,得到视频事件对应时间范围;在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。通过本发明所提供的方法,可以通过通用OCR技术和文本分类技术结合找到对应事件,最终利用深度学习的视频分类技术得到视频剪辑的全自动剪辑方法,并且提升了视频剪辑效率。
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频剪辑方法、视频聚合方法、装置以及系统。
背景技术
目前,各类视频的全自动剪辑一直以来是研究的热点问题。一般来说视频剪辑都是由有经验的编辑来完成,近年来提出了不少的基于计算机视觉的方案,但是这些方案存在着一些问题,首先视频中会存在与当前事件无关内容,这样会导致视频持续时间较长,从而导致视频剪辑的处理事件也较长,完成速度较慢,比如说,足球视频一场比赛在90分钟左右,加上中场休息和广告,一般在两个小时,传统的基于视觉图像的分析技术即使达到实时处理的速度也需要两个小时完成处理,处理时间很长。
另外,传统的自动剪辑方法中,多数采用检测固定的场景相关的物体,然后通过相关物体来确定对应的事件,这样导致定制性较强,无法得到较好的扩展性。
虽然,当前深度学习算法已经发展到整个计算机视觉领域方向,但是传统的视频剪辑方案中一般都没有采用基于深度学习的算法来处理视频,因此,传统的视频剪辑方法相比于深度学习算法,准确性以及处理效率都较低。
发明内容
本发明提供了一种视频剪辑方法、视频聚合方法、装置以及系统,用以解决现有技术中视频剪辑时间较长以及准确性较低的问题。
其具体的技术方案如下:
一种视频剪辑方法,所述方法包括:
分析视频文本信息,得到视频事件对应时间范围;
在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;
将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。
可选的,分析视频文本信息,得到视频事件对应时间范围,包括:
对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;
通过textcnn模型、lstm with attetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;
将三种类型的特征数据首尾相接输入到分类器,得到分类标签;
根据分类标签中的时间信息,得到视频事件对应的时间范围。
可选的,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐,包括:
在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;
通过回归处理,得到所述特征图对应的视频文字区域;
将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
可选的,将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频,包括:
将直播视频分解为三部分;
通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海七牛信息技术有限公司,未经上海七牛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811505962.7/2.html,转载请声明来源钻瓜专利网。