[发明专利]视频检测方法、装置、智能终端及计算机可读存储介质在审
申请号: | 202011537396.5 | 申请日: | 2020-12-23 |
公开(公告)号: | CN114663794A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 盛佳琦;谢思宁 | 申请(专利权)人: | 深圳TCL新技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06V10/764;G10L25/57 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 陈专;谢松 |
地址: | 518052 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检测 方法 装置 智能 终端 计算机 可读 存储 介质 | ||
1.一种视频检测方法,其特征在于,包括:
获取待检测文件,所述待检测文件由若干个图像帧和对应的音频数据组成;
根据预设的提取规则,分别提取所述若干个图像帧对应的初始光流特征和所述音频数据对应的初始声纹特征;
根据所述初始光流特征和所述初始声纹特征,确定所述待检测文件对应的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待检测文件之前,所述方法还包括:
获取视频文件,并将所述视频文件输入已训练的人脸识别模型进行人脸识别,得到所述视频文件中的各个人脸图像和对应的人脸数量;
若所述人脸数量大于零,则确定所述视频文件为所述待检测文件。
3.根据权利要求2所述的方法,其特征在于,所述提取规则包括图像子规则;所述根据预设的提取规则,提取所述若干个图像帧对应的初始光流特征,包括:
根据所述图像子规则,选取所述若干个图像帧中的目标图像,生成目标图像序列;
将所述目标图像序列输入已训练的光流提取模型进行光流提取,得到与所述目标图像序列对应的光流特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像子规则,选取所述若干个图像帧中的目标图像,生成目标图像序列,包括:
根据所述各个人脸图像,确定所述若干个图像帧中的起点帧;
以所述起点帧对应的时刻为起点时刻,根据预设的第一时间间隔,依次选取与预设的采样数量相同的图像帧作为目标帧集合;
按照所述起点帧和所述目标帧集合对应的时刻的先后顺序,将所述起点帧和所述目标帧集合进行排序,生成目标图像序列。
5.根据权利要求2所述的方法,其特征在于,所述提取规则包括音频子规则;所述根据预设的提取规则,提取所述音频数据对应的初始声纹特征,包括:
根据所述音频子规则,选取所述音频数据中的目标音频序列;
将所述目标音频序列输入已训练的声纹提取模型进行声纹特征提取,得到所述目标音频序列对应的初始声纹特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述音频子规则,选取所述音频数据中的目标音频序列,包括:
根据各个所述人脸图像对应的图像帧,确定所述图像帧中的起点帧;
以所述起点帧对应的时刻为起点时刻,根据预设的第二时间间隔,截取所述音频数据中的序列,得到目标音频序列。
7.根据权利要求1-6中任意一项所述的方法,其特征在于,所述根据所述初始光流特征和所述初始声纹特征,确定所述待检测文件对应的检测结果,包括:
将所述初始光流特征和所述初始声纹特征输入已训练的特征检测模型进行特征分类,得到所述待检测文件对应的分类结果;
当所述分类结果为正常时,则确定所述待检测文件为合格文件;或者,
当所述分类结果为异常时,则确定所述待检测文件为异常文件。
8.根据权利要求7所述的方法,其特征在于,所述特征检测模型包括降维模型和特征分类模型;所述将所述初始光流特征和所述初始声纹特征输入已训练的特征检测模型进行特征分类,得到所述待检测文件对应的分类结果,包括:
将所述初始光流特征输入已训练的降维模型进行降维处理,得到降维光流特征;以及
将所述初始声纹特征输入所述降维模型进行降维处理,得到降维声纹特征;
将所述降维光流特征和所述降维声纹特征输入所述特征分类模型进行特征分类,确定所述待检测文件对应的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司,未经深圳TCL新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011537396.5/1.html,转载请声明来源钻瓜专利网。