[发明专利]索引文件的生成方法、装置及系统有效
申请号: | 201711469741.4 | 申请日: | 2017-12-29 |
公开(公告)号: | CN110019874B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 许伦 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/53;G06F16/583 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 文件 生成 方法 装置 系统 | ||
本公开涉及索引文件的生成方法、装置及系统。该方法包括:提取目标图像的局部特征;对所述目标图像的局部特征进行聚类,得到聚类结果;根据所述聚类结果确定所述目标图像的特征向量;将所述目标图像的特征向量发送至子索引节点,以使所述子索引节点将所述目标图像的特征向量加入子索引文件中。本公开通过特征运算节点确定目标图像的特征向量,通过子索引节点将目标图像的特征向量加入子索引文件中,并由汇总索引节点合并各个子索引文件,由此能够提高索引文件的生成速度,从而能够辅助、加速图像检索的进程。
技术领域
本公开涉及计算机技术领域,尤其涉及一种索引文件的生成方法、装置及系统。
背景技术
近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的数量正以惊人的速度在增长。为了使这些庞杂的图像中所包含的信息被有效地访问和利用,必然需要一种能够快速且准确地查找访问图像的技术,即图像的检索技术。随着大规模数字图像库的出现,传统的依赖于人工标注进行的基于文本的图像检索技术已经无法满足用户日益增长的需求,CBIR(Content Based Image Retrieval,基于内容的图像检索)技术便应运而生。CBIR的一般做法是先提取出图像的特征建立特征数据库,这样就把图像库中的一个实例转换成了特征空间中的一个点。而图像特征一般都是高维的矢量数据,所以对图像基于内容的相似检索就转换为对高维特征矢量的最邻近检索。与此同时,对于大规模的图像数据库而言,其特征数据库也是大规模的。因此,传统的顺序扫描方式无法满足用户的检索要求,迫切需要有合适的索引机制来辅助、加速图像检索的进程。
发明内容
有鉴于此,本公开提出了一种索引文件的生成方法、装置及系统。
根据本公开的第一方面,提供了一种索引文件的生成方法,所述方法应用于特征运算节点中,所述方法包括:
提取目标图像的局部特征;
对所述目标图像的局部特征进行聚类,得到聚类结果;
根据所述聚类结果确定所述目标图像的特征向量;
将所述目标图像的特征向量发送至子索引节点,以使所述子索引节点将所述目标图像的特征向量加入子索引文件中。
在一种可能的实现方式中,根据所述聚类结果确定所述目标图像的特征向量,包括:
根据所述聚类结果中的各个聚类中心,确定类中心向量;
对所述类中心向量进行降维处理,得到所述目标图像的特征向量。
在一种可能的实现方式中,所述方法还包括:
对目标视频进行镜头分割,确定所述目标视频的各个镜头;
从所述各个镜头包含的视频帧中,确定所述各个镜头的封面;
将所述各个镜头的封面作为目标图像。
根据本公开的第二方面,提供了一种索引文件的生成方法,所述方法应用于子索引节点中,所述方法包括:
从特征运算节点中获取目标图像的特征向量;
将所述目标图像的特征向量加入子索引文件中;
将所述子索引文件发送至汇总索引节点,以使所述汇总索引节点合并各个子索引文件。
在一种可能的实现方式中,所述目标图像包括目标视频的各个镜头的封面。
根据本公开的第三方面,提供了一种索引文件的生成装置,所述装置包括:
提取模块,用于提取目标图像的局部特征;
聚类模块,用于对所述目标图像的局部特征进行聚类,得到聚类结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711469741.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸数据处理方法、装置及设备
- 下一篇:索引文件的生成方法及装置