[发明专利]视频检测方法、装置及计算机可读存储介质在审
申请号: | 202011074238.0 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112150457A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 王铭喜;李宁;高荣欣 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检测 方法 装置 计算机 可读 存储 介质 | ||
本公开涉及一种视频检测方法、装置及计算机可读存储介质,所述方法包括:获取待检测视频对应的多个特征信息,所述特征信息包括文本信息、图像信息和音频信息;针对每一所述特征信息,确定所述待检测视频在所述特征信息下对应的特征检测结果;根据所述待检测视频对应的多个所述特征检测结果,确定所述待检测视频对应的目标检测结果。由此,一方面可以从待检测视频对应的文本信息、图像信息和音频信息的维度对待检测视频的质量进行检测,从而可以保证确定出的目标检测结果的准确性和可靠性。另一方面,无需基于高质量的视频进行对照评价,从而可以提高该视频检测方法的使用范围,同时可以降低视频检测方法的数据处理量,从而提高视频检测效率。
技术领域
本公开涉及计算机技术领域,尤其涉及一种视频检测方法、装置及计算机可读存储介质。
背景技术
UGC,User Generated Content,也就是用户生成内容,即用户原创内容,用户可以将自己原创的内容通过互联网平台进行上传,从而可以展示或者提供给其他用户。由于用户拍摄短视频采用的拍摄设备千变万化,以及用户拍摄环境、方式等的偏差,导致这些短视频质量参差不齐。
相关技术中,可以通过对视频的质量评估,从而对用户上传的视频进行检测。目前通常是针对视频画质的质量评价,比如:PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)和SSIM(Structural Similarity),但是这些评价方法有个前提,必须有一个高清的视频作为参考依据才能进行评估。
发明内容
为克服相关技术中存在的问题,本公开提供一种视频检测方法、装置及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种视频检测方法,包括:
获取待检测视频对应的多个特征信息,所述特征信息包括文本信息、图像信息和音频信息;
针对每一所述特征信息,确定所述待检测视频在所述特征信息下对应的特征检测结果;
根据所述待检测视频对应的多个所述特征检测结果,确定所述待检测视频对应的目标检测结果。
可选地,所述图像信息包括所述检测视频对应的视频帧图像信息和/或封面图像信息;所述确定所述待检测视频在所述特征信息下对应的特征检测结果,包括:
将所述视频帧图像信息和/或封面图像信息输入图像检测模型,获得所述待检测视频对应的图像信息的特征检测结果,其中,所述图像检测模型的训练样本中的目标样本图像通过如下方式确定:
获取分辨率小于或等于目标分辨率的候选样本图像;
针对分辨率小于所述目标分辨率的候选样本图像,根据所述候选样本图像的分辨率和所述目标分辨率在所述候选样本图像中增加目标像素点,获得分辨率为所述目标分辨率的扩展样本图像,其中所述目标样本图像包括所述扩展样本图像和分辨率为所述目标分辨率的候选样本图像。
可选地,所述图像检测模型包括残差子模型,池化层和全连接层,其中,所述残差子模型为预训练的迁移学习模型,在所述图像检测模型的训练过程中,根据所述训练样本确定出的图像检测模型的损失值调整所述池化层和所述全连接层的参数,以获得所述图像检测模型。
可选地,所述特征信息为音频信息;所述确定所述待检测视频在所述特征信息下对应的特征检测结果,包括:
将所述音频信息输入音频检测模型,获得所述待检测视频对应的音频信息的特征检测结果,其中,所述音频检测模型是基于多分类任务模型进行训练得出的,所述音频检测模型的每一分类对应的训练样本的数量相同。
可选地,所述音频检测模型的损失函数为所述音频模型的多分类对应的交叉熵函数和最大平均差异函数之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011074238.0/2.html,转载请声明来源钻瓜专利网。