[发明专利]基于比较的主动搜索/学习在审
申请号: | 201380028023.7 | 申请日: | 2013-05-09 |
公开(公告)号: | CN104541269A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | E.约安尼迪斯;L.马索利 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 吕晓章 |
地址: | 法国伊西*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 比较 主动 搜索 学习 | ||
相关申请的交叉引用
本申请要求2012年5月9日提交的美国临时申请第61/644519号的权益,其通过引用整体合并于此。
技术领域
本原理涉及基于比较的主动搜索和学习。
背景技术
通过比较的内容搜索是其中用户以下列迭代方式定位大数据库中的目标对象的方法。在每一个步骤中,数据库向用户呈现两个对象,并且用户在这对对象中选择最接近她头脑中的目标的对象。在下一次迭代中,数据库基于用户的较早的选择呈现新的一对对象。该过程继续,直到基于用户的回答,数据库可以唯一地识别她头脑中的目标。
该类型的交互导航,也被称为探索搜索,具有许多现实生活中的应用。一个示例是在不受控制的环境中拍摄的人的图片的数据库中导航,例如Fickr或Picasa。自动方法可能无法从这些照片中提取有意义的特征。此外,在许多实践情形中,呈现类似低级别描述符(例如SIFT(尺度不变特征变换)特征)的图像可以具有非常不同的语义内容和高级别描述,并且因此被用户不同地理解。另一方面,搜索特定的人的人类可以容易地从图片列表中选择最类似于她头脑中的人的主体(subject)。
考虑由集合N表示并且被赋予距离度量(metric)d的对象的数据库,其捕捉不同对象之间的“距离”或“相异度”。给定具体对象t∈N,“比较语句(oracle)”是可以回答下列类型的问题的语句:
“在N中的两个对象x和y之间,在度量d之下哪一个最接近t?”
形式上,人类用户的行为可以通过这种比较语句来建模。具体地,假设对象的数据库是由集合N表示并且被赋予距离度量d的图片。
通过比较的交互式内容搜索的目的是找到对语句/人类呈现的提出的对象对的序列,导致以尽可能少的询问识别目标对象。
通过比较的内容搜索是最接近邻居搜索(NNS)的特殊情况,并且可以视为考虑对嵌入在度量空间中的对象的NNS问题的工作的延伸。还假设该嵌入具有小的固有维度,该假设在实践中受到支持。具体地,现有技术方式引入导航网,其是用于在加倍(doubling)度量空间中支持NNS的确定数据结构。对于嵌入在满足特定球形填充属性(sphere-packing property)的空间中的对象考虑类似技术,而其他工作依赖于增长受限度量;全部上面的假设都与这里考虑的加倍常数有关,在全部上述现有技术方式中,目标对象上的需求被假设为均匀的(homogeneous)。
在若干现有工作中引入了具有对比较语句的访问的NNS。这些工作的相当大的优势在于消除了对象先验地嵌入在度量空间中的假设;除了要求对象之间的相似度由距离度量捕捉,这些现有工作仅假设任何两个对象可以通过比较语句关于它们与任何目标的相似度而排名。然而,这些工作也假设均匀需求,并且本原理可以视为使用不均匀的比较的搜索的扩展。在该方面中,另一现有方式也假设不均匀需求分布。然而,在度量空间存在并且搜索算法知道它的假设之下,使用本原理提供在平均搜索成本方面更好的结果。上述方式的主要问题在于该方式是无记忆的,即其不利用先前的比较,而在本解决方案中,该问题通过部署E网数据结构而解决。
发明内容
现有技术的这些和其他缺陷和缺点通过本原理而解决,其涉及用于基于比较的主动搜索的方法。
根据本原理的一方面,提供用于在数据库内搜索内容的若干方法和若干装置。第一方法包括用于在数据库内搜索目标的步骤,其中通过首先构造具有包含至少一个目标的大小的节点的网,在网内选定节点的集合,并且比较目标与节点的集合内的每一个节点的距离。所述方法还包括根据比较步骤在节点的集合内选择最接近目标的节点,并且响应于选择步骤将网的大小减小为仍然包含目标的大小。所述方法还包括重复选定、比较、选择和减小步骤,直到网的大小足够小到仅包含目标。
根据本原理的另一方面,提供第一装置。所述装置包括用于构造具有包含至少一个目标的大小的网的部件,以及用于在网内选定节点的集合的部件。所述装置还包括比较目标与节点的集合内的每一个节点的距离的比较器部件,以及根据比较器部件在节点的集合内找到最接近目标的节点的用于选择的部件。所述装置还包括响应于选择部件将网的大小减小为仍然包含目标的大小的电路,以及用于使得选定部件、比较器部件、选择部件和减小部件重复它们的操作,直到网的大小足够小到仅包含目标的控制部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司;,未经汤姆逊许可公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380028023.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于客户端‑云行为分析器的架构
- 下一篇:查询结构化和非结构化数据库