[发明专利]视频查询方法、装置、电子设备及存储介质在审
申请号: | 202111255750.X | 申请日: | 2021-10-27 |
公开(公告)号: | CN113987271A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 张一鸣;李弘宇;刘璟;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 皇甫韵啸;包莉莉 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 查询 方法 装置 电子设备 存储 介质 | ||
1.一种视频查询方法,所述方法包括:
获取用户的查询信息;
查询预先存储的多个视频各自对应的文本信息,得到与所述查询信息匹配的候选文本信息;所述文本信息包括从对应视频的视觉或语音中的至少一个通道提取的表征视频内容的信息;
基于所述候选文本信息,确定与所述查询信息匹配的目标视频。
2.根据权利要求1所述的方法,其中,所述查询预先存储的多个视频各自对应的文本信息,得到与所述查询信息匹配的候选文本信息,包括:
在所述文本信息包括文本片段和辅助信息的情况下,查询预先存储的多个视频各自对应的文本片段和辅助信息,得到与所述查询信息匹配的文本片段和辅助信息;
将所述匹配的文本片段和辅助信息作为所述候选文本信息。
3.根据权利要求2所述的方法,其中,所述基于所述候选文本信息,确定与所述查询信息匹配的目标视频,包括:
基于所述候选文本信息中的文本片段,确定与所述查询信息匹配的目标文本信息;
基于所述目标文本信息,确定与所述查询信息匹配的目标视频。
4.根据权利要求3所述的方法,其中,在所述基于所述目标文本信息,确定与所述查询信息匹配的目标视频之后,还包括:
基于所述目标文本信息,确定所述目标视频中与所述查询信息匹配的视频片段的开始时刻和结束时刻。
5.根据权利要求3所述的方法,其中,所述基于所述候选文本信息中的文本片段,确定与所述查询信息匹配的目标文本信息,包括:
获取所述候选文本信息中的文本片段的上下文信息,以及所述候选文本信息对应的视频的属性信息;
将所述候选文本信息中的文本片段与对应的所述上下文信息或属性信息中的至少一项进行拼接,得到拼接文本信息;
从各所述拼接文本信息中确定与所述查询信息匹配的目标文本信息。
6.根据权利要求5所述的方法,其中,所述从各所述拼接文本信息中确定与所述查询信息匹配的目标文本信息,包括:
通过视频内容精排模型,从各所述拼接文本信息中确定与所述查询信息匹配的目标文本信息;
其中,所述视频内容精排模型是通过第一训练样本集训练得到的;所述第一训练样本集包括多个第一训练样本以及各第一训练样本各自对应的第一样本标签,每个第一训练样本包括第一查询文本和第一拼接文本组成的样本对,所述第一拼接文本包括与所述第一查询文本匹配的第一候选文本、所述第一候选文本的上下文信息、所述第一候选文本对应的查询视频的属性信息;所述第一样本标签表征所述第一查询文本和所述第一拼接文本的匹配程度。
7.根据权利要求2所述的方法,其中,所述查询预先存储的多个视频各自对应的文本信息,得到与所述查询信息匹配的候选文本信息,包括:
基于视频内容语义检索模型,查询预先存储的多个视频各自对应的文本信息,得到与所述查询信息匹配的候选文本信息;
其中,所述视频内容语义检索模型是基于第二训练样本集训练得到的;所述第二训练样本集包括多个第二训练样本以及各第二训练样本各自对应的第二样本标签,每个第二训练样本包括第二查询文本和第二候选文本组成的样本对,所述第二候选文本包括与所述第二查询文本匹配的第二文本片段和所述第二文本片段的辅助信息;所述第二样本标签表征所述第二查询文本和所述第二候选文本的匹配程度。
8.根据权利要求7所述的方法,其中,所述第二训练样本集是通过以下方式得到的:
通过初始文本匹配模型获取正样本集和第一负样本集;
通过批次内负采样的方式获取第二负样本集;
将所述正样本集、所述第一负样本集和所述第二负样本集作为所述第二训练样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111255750.X/1.html,转载请声明来源钻瓜专利网。