[发明专利]视频搜索方法及装置、索引构建方法及装置在审
申请号: | 201911398726.4 | 申请日: | 2019-12-30 |
公开(公告)号: | CN113127679A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 吕逸良;唐铭谦;韩振;潘玉霖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/71 | 分类号: | G06F16/71;G06F16/73;G06F16/78 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 搜索 方法 装置 索引 构建 | ||
本说明书实施例提供视频搜索方法及装置、索引构建方法及装置,其中,所述视频搜索方法包括在接收用户输入的对目标视频的搜索请求后,基于预设算法对所述搜索请求中携带有针对所述目标视频的多模态搜索数据进行处理,然后将该多模态搜索数据的处理结果输入至对应的预先构建的索引中,搜索得到该目标视频;使得视频搜索方法该基于该多模态搜索数据快速、准确的得到该目标视频,提升用户体验。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及两种视频搜索方法以及一种索引构建方法。本说明书一个或者多个实施例同时涉及两种视频搜索装置,一种索引构建装置,三种计算设备,以及一种计算机可读存储介质。
背景技术
随着视频网络的普及和发展,涌现出很多视频网站,方便用户在视频网站上搜索视频进行观看,极大的丰富了用户的生活。
目前,视频搜索大多使用视频文本信息实现对视频的搜索,例如在某视频网站输入视频名称实现对视频的搜索,但是很多视频存在名称相同的情况,输入一个视频名称会出现若干个视频结果,用户需要对每个搜索结果点击观看才可以获得自己想要观看的视频。由此可见,现有搜索方式准确率较低,从而降低了用户体验。
因此,如何提高视频搜索的准确率是目前急需解决的技术问题。
发明内容
有鉴于此,本说明书施例提供了两种视频搜索方法以及一种索引构建方法。本说明书一个或者多个实施例同时涉及两种视频搜索装置,一种索引构建装置,三种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种视频搜索方法,包括:
接收用户输入的对目标视频的搜索请求,其中,所述搜索请求中携带有针对所述目标视频的多模态搜索数据;
基于预设算法对所述多模态搜索数据进行处理,得到所述多模态搜索数据的处理结果;
将所述多模态搜索数据的处理结果输入至对应的预先构建的索引中,搜索得到所述目标视频。
可选的,所述多模态搜索数据包括文本数据;
所述基于所述多模态搜索数据,获取所述多模态搜索数据的处理结果包括:
基于预设的文本算法对所述文本数据进行处理,得到所述文本数据的文本语意标签。
可选的,所述多模态搜索数据包括图像数据;
所述基于所述多模态搜索数据,获取所述多模态搜索数据的处理结果包括:
基于预设的图像算法对所述图像数据进行处理,得到所述图像数据的图像语意标签;
基于预设的向量化模型对所述图像数据进行处理,得到所述图像数据的向量化描述。
可选的,所述多模态搜索数据包括视频数据;
所述基于所述多模态搜索数据,获取所述多模态搜索数据的处理结果之前,还包括:
将所述视频数据拆分为视频元数据和视频流数据,并基于预设的分割方式将所述视频流数据分割为视频帧序列。
可选的,所述基于所述多模态搜索数据,获取所述多模态搜索数据的处理结果包括:
基于所述文本算法对所述视频元数据进行处理,得到所述视频元数据的文本语意标签;
基于预设的视频算法对所述视频帧序列中的视频帧进行处理,得到所述视频帧的视频语意标签;
基于所述向量化模型对所述视频帧进行处理,得到所述视频帧的向量化描述。
可选的,所述将所述多模态搜索数据的处理结果输入至对应的预先构建的索引中,搜索得到所述目标视频包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398726.4/2.html,转载请声明来源钻瓜专利网。