[发明专利]用于编索引、相似度搜索和分类的矢量变换有效

专利信息
申请号: 201180061086.3 申请日: 2011-11-03
公开(公告)号: CN103283247A 公开(公告)日: 2013-09-04
发明(设计)人: J·耶格尼克 申请(专利权)人: 谷歌公司
主分类号: H04N21/234 分类号: H04N21/234;G06F17/00
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;陈颖
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 索引 相似 搜索 分类 矢量 变换
【说明书】:

有关申请的交叉引用

本申请要求对于2010年11月11日提交的第61/412,711号临时申请的优先权,其通过引用并入于此。

技术领域

本公开内容总体涉及数据编索引、相似度搜索和分类领域,并且更具体地涉及操纵高维矢量空间数据。

背景技术

矢量常用来表示各种现象的特征空间。例如矢量用来表示图像、视频、音频剪辑和其它媒体的特征。应当注意,矢量空间操作的效用不限于数字媒体、而是还可以应用于其它数据、应用于物理对象或者应用于能够特征表示的任何其它实体。在媒体空间中,特征包括色分布(例如使用4x4个像素色调和饱和度直方图)、跨越色通道的色密度的均值和方差、在像素矩形以内和以外的色强度差、边缘、均值边缘强度、纹理、视频运动、音频音量、音频声谱特征、单词或者脸部存在于图像中或者任何其它适当的媒体性质。

矢量空间表示在数字媒体中的分类、编索引和相似度确定中特别有用;确定在数字媒体特征矢量之间的距离对这些操作是基本的。数字媒体的人工分类和编索引需要人类操作者并且针对大型媒体汇集而言造成昂贵和扩张到令人望而却步的操作。另外,在大型媒体库内的相似度搜索需要分析库中的所有条目,并且即使自动化的库分析也需要处理资源密集能力。遗憾的是,数字媒体的高维特征矢量也易有噪声,从而减少矢量距离确定对这样的矢量的有效性、并且减少用于检测对少量矢量特征的改变所产生的矢量距离差的能力。

许多数据分类任务依赖于矢量空间表示来表示感兴趣的特定数据。一种常见的数据分类操作涉及到确定在两个数据对象之间的相似度。使用数据对象的矢量空间表示允许基于在表示数据对象的两个矢量(诸如坐标矢量)之间的距离(诸如欧几里得距离)确定相似度。单个矢量分量的值的改变对在矢量之间的距离具有与矢量的维度数目成反比的影响。因此,矢量中的维度数目越大,单个矢量分量的改变对在矢量之间的距离具有的影响就越小。

在使用中,矢量空间操作中的矢量元素易受到无论自然地或者发生的噪声的影响。随着矢量空间中的维数增加,影响矢量个别元素的噪声的混合越来越多地影响在两个矢量之间的距离确定。距离确定中的混合噪声的量值(magnitude)可能由于对在高维矢量空间的单个矢量维度的改变而超过距离确定的改变量值。这在其中希望度量矢量中的少量元素的改变所引起的在矢量之间的距离改变的实例中成问题。

发明内容

对表示媒体对象或者其它数据对象的特征矢量进行编码。可以从存储模块获取或者可以由特征矢量生成器生成特征矢量。媒体对象或者其它数据对象可以例如是图像、视频、音频剪辑、数据库、电子表格或者文档。一个或者多个排列被生成,每个排列包括与特征矢量相同维数的序数矢量。随机生成一个或者多个排列从而产生每个排列的序数的随机排序。通过根据一个或者多个排列的序数对特征矢量的条目重新排序用排列来排列特征矢量,从而创建一个或者多个排列的特征矢量。

例如随机选择窗口大小。窗口大小可以从2到特征矢量的维数变化。可以选择窗口大小,从而朝着排列的特征矢量的开头来偏置编码的特征矢量。根据选择的窗口大小截断排列的特征矢量,从而维持数目与选择的窗口大小等同的开始矢量值,并且丢弃其余矢量值。标识每个截断的排列的特征矢量的最大值的索引并且例如使用一位热码编码来编码。可以将编码的索引连接成可以被存储用于后续获取的单个稀疏二进制矢量。

可以针对媒体库中的每个媒体对象产生一个或者多个稀疏二进制矢量(每个稀疏二进制数量与媒体对象的一个或者多个特定特征相关联)。可以在媒体库中与媒体对象结合存储稀疏二进制矢量。可以通过计算在与目标媒体对象相关联的稀疏二进制矢量和与每个存储的媒体对象相关联的一个或者多个稀疏二进制矢量之间的点积来对存储的稀疏二进制矢量和与目标媒体对象相关联的稀疏二进制矢量执行在目标媒体对象与媒体库之间的相似度搜索。可以选择与最大点积相关联的媒体对象作为关于与稀疏二进制相关联的一个或者多个特征而与目标媒体对象最相似的存储的媒体对象。

在一个实施例中,可以在多项式空间上对特征矢量编码。生成排列集合,集合中的排列数目等于多项空间的次。然后用排列集合来排列特征矢量,并且根据选择的窗口大小来截断所得的排列的特征矢量。创建与截断的排列矢量相同维数的乘积矢量,并且乘积矢量在每个索引处的值是每个截断的排列的矢量在特定索引处的值的乘积。然后标识乘积矢量的最大值的索引并且例如使用一位热码编码来编码以产生在多项式空间上表示特征矢量的稀疏二进制矢量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180061086.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top