[发明专利]视频检索方法、模型训练方法、装置、设备及存储介质在审
申请号: | 202011364213.4 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112487239A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 贺峰;汪琦;冯知凡;柴春光 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/783;G06N3/04;G06N3/08 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;杨瑾瑾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检索 方法 模型 训练 装置 设备 存储 介质 | ||
本申请公开了视频检索方法、模型训练方法、装置、设备及计算机存储介质,涉及NLP(Natural Language Processing,自然语言处理)、人工智能、大数据、计算机视觉、智能搜索、知识图谱和深度学习领域。具体实现方案为:从检索文本中提取文本特征;从待分析视频中提取视觉特征;根据所述文本特征和所述视觉特征,得到所述检索文本和所述视频的特征相似度以及所述视频与所述检索文本中包含的概念的概念置信度;根据所述特征相似度和所述概念置信度,确定所述视频在所述检索文本对应的检索结果中的排序。
技术领域
本申请涉及数据处理技术领域,尤其涉及智能搜索和知识图谱技术领域。
背景技术
互联网(internet),又称国际网络,指的是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。随着计算机技术的发展,世界逐渐进入互联网时代。
互联网时代的一个显著的特征就是数据地成倍增长,而视频数据也不例外,面对日益增长的视频库,需要的是一种高效并且精确的检索技术。
发明内容
本申请提供了一种视频检索方法、模型训练方法、装置、设备以及存储介质。
根据本申请的一方面,提供了一种视频检索方法,包括:
从检索文本中提取文本特征;
从待分析视频中提取视觉特征;
根据文本特征和视觉特征,得到检索文本和视频的特征相似度,以及视频与检索文本中包含的概念的概念置信度;
根据特征相似度和概念置信度,确定视频在检索文本对应的检索结果中的排序。
根据本申请的另一方面,提供了一种模型训练方法,包括:
获取用于训练模型的正样本和负样本;正样本包括视频及视频的标注概念,负样本包括视频及任意一个与标注概念不同的其它概念;
将正样本和负样本输入待训练的视频概念感知模型,得到标注概念与视频的第一概念相关性以及其它概念与视频的第二概念相关性;
根据第一概念相关性和第二概念相关性,训练待训练的视频概念感知模型,得到视频概念感知模型。
根据本申请的另一方面,提供了一种视频检索装置,包括:
文本特征模块,用于从检索文本中提取文本特征;
视觉特征模块,用于从待分析视频中提取视觉特征;
特征处理模块,用于根据文本特征和视觉特征,得到检索文本和视频的特征相似度以及视频与检索文本中包含的概念的概念置信度;
排序模块,用于根据特征相似度和概念置信度,确定视频在检索文本对应的检索结果中的排序。
根据本申请的又一方面,提供了一种模型训练装置,包括:
样本模块,用于获取用于训练模型的正样本和负样本;正样本包括视频及视频的标注概念,负样本包括视频及任意一个与标注概念不同的其它概念;
概念模块,用于将正样本和负样本输入待训练的视频概念感知模型,得到标注概念与视频的第一概念相关性以及其它概念与视频的第二概念相关性;
训练模块,用于根据第一概念相关性和第二概念相关性,训练待训练的视频概念感知模型,得到视频概念感知模型。
根据本申请的又一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011364213.4/2.html,转载请声明来源钻瓜专利网。