[发明专利]一种生成视频摘要的方法及装置有效

申请号：	201810065769.X	申请日：	2018-01-23
公开（公告）号：	CN108307250B	公开（公告）日：	2020-10-30
发明（设计）人：	李威	申请（专利权）人：	浙江大华技术股份有限公司
主分类号：	H04N21/8549	分类号：	H04N21/8549;H04N21/439
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	310053 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种生成视频摘要方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种生成视频摘要的方法及装置，用以利用音频识别技术快速生成视频摘要，无需对视频内容进行智能分析，提高了生成视频摘要的效率。所述生成视频摘要的方法包括：将音视频文件按照帧的顺序依次分离出对应的音频帧和视频帧；当确定当前音频帧的声音类型与目标音频的声音类型相同时，确定包括当前音频帧在内的、预设时长内的、连续多个音频帧的特征信息；当确定多个音频帧的特征信息与目标音频的特征信息匹配时，确定多个音频帧的发生时间段；根据发生时间段，确定与发生时间段相同的、连续多个视频帧；根据上述步骤确定完音视频文件中包括的、多个所述连续多个视频帧后，将确定的多个所述连续多个视频帧生成视频摘要。

技术领域

本发明涉及视频快速检索领域，尤其涉及一种生成视频摘要的方法及装置。

背景技术

现有的技术方案中，生成视频摘要的方法基本都是利用智能图像分析算法，从视频中提取物体目标信息，再根据目标出现时间等信息融合在一起生成视频摘要的方法，最后用于存储和视频播放。

目前的产品视频摘要的技术方案都要借助智能视频分析技术，有如下缺点：1)视频分析计算量大，难度高；2)视频数据量大，生成摘要速度慢；3)无法感知音频信息。

发明内容

本发明提供一种生成视频摘要的方法及装置，用以利用音频识别技术快速生成视频摘要，无需对视频内容进行智能分析，提高了生成视频摘要的效率。

本发明实施例提供了一种生成视频摘要的方法，该方法包括：

将音视频文件按照帧的顺序依次分离出对应的音频帧和视频帧；

当确定当前音频帧的声音类型与目标音频的声音类型相同时，确定包括所述当前音频帧在内的、预设时长内的、连续多个音频帧的特征信息；

当确定所述多个音频帧的特征信息与目标音频的特征信息匹配时，确定所述多个音频帧的发生时间段；

根据所述发生时间段，确定与所述发生时间段相同的、连续多个视频帧；