[发明专利]一种视频识别方法和装置有效
申请号: | 201910926328.9 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110677718B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张义飞;康斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/845 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 识别 方法 装置 | ||
本申请实施例公开了一种视频识别方法和装置,其中,本申请实施例可以获取待识别的第一视频;对所述第一视频进行音视频分离,得到所述第一视频的第一音频信息和第一图像帧;基于所述第一图像帧,获取与所述第一视频相似的第二视频;获取所述第二视频的第二音频信息;获取所述第一音频信息与所述第二音频信息的音频相似参数;基于所述音频相似参数,对所述第一视频进行音频异常识别,得到识别结果。本申请通过分离出待识别的第一视频的第一图像帧,找到与第一视频相似的第二视频,然后比较第一视频和第二视频的音频,从而可以准确、快速地识别出第一视频是否为声音异常的视频。
技术领域
本申请涉及通讯的技术领域,具体涉及一种视频识别方法和装置。
背景技术
近年来,随着用户生成内容模式的发展,越来越多的用户会将原创或者二次加工的视频内容发布在数据共享平台上进行分享,但是一些对原版视频进行重新录制、配音、加速、减速后得到的视频,与原版视频相比,声音会出现异常,不适合推荐给用户观看。但是目前还没有能够准确、快速地自动识别出这种声音异常的视频的方法。
发明内容
有鉴于此,本申请实施例提供了一种视频识别方法和装置,可以准确、快速地识别出声音异常的视频。
第一方面,本申请实施例提供了一种视频识别方法,包括:
在一些实施例中,所述视频识别方法,包括:
获取待识别的第一视频;
对所述第一视频进行音视频分离,得到所述第一视频的第一音频信息和第一图像帧;
基于所述第一图像帧,获取与所述第一视频相似的第二视频;
获取所述第二视频的第二音频信息;
获取所述第一音频信息与所述第二音频信息的音频相似参数;
基于所述音频相似参数,对所述第一视频进行音频异常识别,得到识别结果。
在一实施例中,所述基于所述第一图像帧,获取与所述第一视频相似的第二视频,包括:
获取所述第一图像帧的图片特征信息;
基于所述图片特征信息,获取与所述第一视频具有相似图像帧的候选相似视频片段集合,所述候选视频片段集合包括多个候选相似视频片段;
基于所述候选相似视频片段,选取与所述第一视频相似的第二视频。
在一实施例中,所述第一视频包括多个第一视频片段,所述基于所述候选相似视频片段,选取与所述第一视频相似的第二视频,包括:
获取所述候选相似视频片段与所述第一视频片段的片段相似度;
基于所述片段相似度,从所述候选相似视频片段集合中选取与所述第一视频片段对应的相似视频片段;
基于所述相似视频片段,选取与所述第一视频相似的第二视频。
在一实施例中,所述基于所述相似视频片段,选取与所述第一视频相似的第二视频,包括:
获取所述相似视频片段对应的相似视频,得到相似视频集合,所述相似视频集合包括多个相似视频;
对所述相似视频中的相似视频片段进行统计,得到所述相似视频对应的统计参数;
基于所述相似视频对应的统计参数,从所述相似视频集合中选取与所述第一视频相似的第二视频。
在一实施例中,所述视频识别方法,还包括:
统计所述第二视频中的相似视频片段的时间信息;
基于所述时间信息,从所述第二音频信息中,分割出用于音频对比的第二音频信息片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910926328.9/2.html,转载请声明来源钻瓜专利网。