[发明专利]一种视频识别方法和装置有效
申请号: | 201910926328.9 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110677718B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张义飞;康斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/845 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 识别 方法 装置 | ||
1.一种视频识别方法,其特征在于,包括:
获取待识别的第一视频;
对所述第一视频进行音视频分离,得到所述第一视频的第一音频信息和第一图像帧;
基于所述第一图像帧,获取与所述第一视频相似的第二视频;
获取所述第二视频的第二音频信息;
获取所述第一音频信息与所述第二音频信息的音频相似参数;
基于所述音频相似参数,对所述第一视频进行音频异常识别,得到识别结果。
2.如权利要求1所述的视频识别方法,其特征在于,所述基于所述第一图像帧,获取与所述第一视频相似的第二视频,包括:
获取所述第一图像帧的图片特征信息;
基于所述图片特征信息,获取与所述第一视频具有相似图像帧的候选相似视频片段集合,所述候选相似视频片段集合包括多个候选相似视频片段;
基于所述候选相似视频片段,选取与所述第一视频相似的第二视频。
3.如权利要求2所述的视频识别方法,其特征在于,所述第一视频包括多个第一视频片段,所述基于所述候选相似视频片段,选取与所述第一视频相似的第二视频,包括:
获取所述候选相似视频片段与所述第一视频片段的片段相似度;
基于所述片段相似度,从所述候选相似视频片段集合中选取与所述第一视频片段对应的相似视频片段;
基于所述相似视频片段,选取与所述第一视频相似的第二视频。
4.如权利要求3所述的视频识别方法,其特征在于,所述基于所述相似视频片段,选取与所述第一视频相似的第二视频,包括:
获取所述相似视频片段对应的相似视频,得到相似视频集合,所述相似视频集合包括多个相似视频;
对所述相似视频中的相似视频片段进行统计,得到所述相似视频对应的统计参数;
基于所述相似视频对应的统计参数,从所述相似视频集合中选取与所述第一视频相似的第二视频。
5.如权利要求1所述的视频识别方法,其特征在于,在所述获取所述第一音频信息与所述第二音频信息的音频相似参数之前,还包括:
统计所述第二视频中的相似视频片段的时间信息;
基于所述时间信息,从所述第二音频信息中,分割出用于音频对比的第二音频信息片段;
从所述第一音频信息中,分割出与所述第二音频信息片段对应的第一音频信息片段;
所述获取所述第一音频信息与所述第二音频信息的音频相似参数,包括:
获取所述第一音频信息片段与所述第二音频信息片段的音频相似参数。
6.如权利要求5所述的视频识别方法,其特征在于,所述获取所述第一音频信息片段与所述第二音频信息片段的音频相似参数,包括:
将所述第一音频信息片段分割为多个第一音频子片段;
基于所述第一音频子片段,将所述第二音频信息片段分割为多个第二音频子片段;
获取所述第二音频子片段与所述第一音频子片段的子片段相似参数;
基于所述子片段相似参数,获取所述第一音频信息片段与所述第二音频信息片段的音频相似参数。
7.如权利要求6所述的视频识别方法,其特征在于,所述基于所述子片段相似参数,获取所述第一音频信息片段与所述第二音频信息片段的音频相似参数,包括:
获取所述子片段相似参数与第一预设阈值之间的比较结果;
基于所述比较结果,获取所述第一音频信息片段与所述第二音频信息片段的音频相似参数。
8.如权利要求6所述的视频识别方法,其特征在于,获取所述第二音频子片段与所述第一音频子片段的子片段相似参数,包括:
获取所述第一音频子片段的第一音频特征信息;
获取所述第二音频子片段的第二音频特征信息;
获取所述第一音频特征信息与所述第二音频特征信息的特征相似度;
基于所述特征相似度,获取所述第二音频子片段与所述第一音频子片段的子片段相似参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910926328.9/1.html,转载请声明来源钻瓜专利网。