[发明专利]视频检索方法、装置、电子设备和存储介质有效
申请号: | 202010620349.0 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111782874B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 贾若然;谭昶;李梓赫;傅云翔 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/75 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检索 方法 装置 电子设备 存储 介质 | ||
1.一种视频检索方法,其特征在于,包括:
确定待检索视频;
对所述待检索视频中所有图像帧进行聚类,得到多个图像簇,从每一图像簇中分别选取每一图像簇的关键帧;
基于每一关键帧,确定所述待检索视频的视频检索结果;
所述基于每一关键帧,确定所述待检索视频的视频检索结果,具体包括:
确定任一关键帧的描述特征,所述关键帧的描述特征是通过多个尺度下的区域特征提取层对图像特征进行不同尺度不同位置的区域特征提取得到的;
基于所述任一关键帧的描述特征,在预设视频库中进行检索,得到所述任一关键帧的图像帧检索结果;
基于每一关键帧的图像帧检索结果,确定所述待检索视频的视频检索结果。
2.根据权利要求1所述的视频检索方法,其特征在于,所述对所述待检索视频中所有图像帧进行聚类,得到多个图像簇,具体包括:
若所述待检索视频中当前图像帧的图像特征与任一图像簇的聚类中心特征之间的相似度大于等于预设相似度阈值,则将所述当前图像帧加入到最大相似度对应的图像簇中;
否则,创建新的图像簇,将所述当前图像帧加入到所述新的图像簇中;
将所述待检索视频中的下一图像帧更新为当前图像帧。
3.根据权利要求1所述的视频检索方法,其特征在于,所述确定任一关键帧的描述特征,具体包括:
将任一关键帧输入至描述特征提取模型的图像特征提取层,得到所述图像特征提取层输出的图像特征;
将所述图像特征输入至所述描述特征提取模型的多个尺度下的区域特征提取层,分别得到每一尺度下的区域特征提取层输出的对应尺度下若干个采样区域的区域特征;
将每一尺度下每一采样区域的区域特征输入至所述描述特征提取模型的尺度融合层,得到所述尺度融合层输出的所述描述特征。
4.根据权利要求3所述的视频检索方法,其特征在于,所述将所述图像特征输入至所述描述特征提取模型的多个尺度下的区域特征提取层,分别得到每一尺度下的区域特征提取层输出的对应尺度下若干个采样区域的区域特征,具体包括:
将所述图像特征输入至任一尺度下的区域特征提取层,由所述任一尺度下的区域特征提取层基于所述任一尺度下的区域大小对所述图像特征中每一通道的通道特征进行采样,得到所述任一尺度下的区域特征提取层输出的若干个采样区域在每一通道的通道区域特征,作为所述任一尺度下每一采样区域的区域特征。
5.根据权利要求1所述的视频检索方法,其特征在于,所述基于每一关键帧的图像帧检索结果,确定所述待检索视频的视频检索结果,具体包括:
基于每一关键帧的图像帧检索结果,确定所述待检索视频的若干个候选匹配视频,以及所述待检索视频与每一候选匹配视频之间的若干个候选帧匹配对;
基于所述待检索视频与任一候选匹配视频之间的若干个候选帧匹配对,确定所述任一候选匹配视频的匹配得分;
基于每一候选匹配视频的匹配得分,确定所述待检索视频的视频检索结果。
6.根据权利要求5所述的视频检索方法,其特征在于,所述基于所述待检索视频与任一候选匹配视频之间的若干个候选帧匹配对,确定所述任一候选匹配视频的匹配得分,之前还包括:
若所述待检索视频与任一候选匹配视频之间的任一候选帧匹配对的图像帧时差不处于预设时差区间内,则删除所述任一候选帧匹配对;
所述预设时差区间是基于所述待检索视频与所述任一候选匹配视频之间的每一候选帧匹配对的图像帧时差确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010620349.0/1.html,转载请声明来源钻瓜专利网。