[发明专利]搜索方法、搜索程序以及搜索装置有效
申请号: | 201410697191.1 | 申请日: | 2014-11-26 |
公开(公告)号: | CN104731847B | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 野间唯;此岛真喜子 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;韩雪梅 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 程序 以及 装置 | ||
本公开涉及一种搜索方法、搜索程序以及搜索装置。根据实施例的搜索装置基于包括节点和距离的参数将特征向量映射在超球体上,其中,在交点处m维特征空间与经过该超球体的直线相交,该超球体存在于维度比m更大的空间中,该距离是从超球体的北极至特征空间的距离。在这种情况下,搜索装置搜索允许映射在超球体上的特征向量的位置集中在超球体的预定半球上的参数。
技术领域
本文所公开的实施例涉及搜索方法等。
背景技术
例如,为了认证各种系统的用户,而获取用户的生物统计信息,然后,确定与所获取的生物统计信息匹配的生物统计信息是否已被数据库所预先记录并且能在该数据库中找到。这里,由于在认证时要获取的生物统计信息很少完全匹配在登记时获取的生物统计信息,所以能够有效地执行相似性搜索。
为了表达用于执行相似性搜索的相似性等级,可使用将生物统计信息的特征值转换成散列向量(hash vetor)的技术。该技术将具有相近汉明距离(close hammingdistance)的散列向量的每条生物统计信息识别为相似生物统计信息。
传统技术已采用超平面将特征值转换成散列向量。然而,还可使用采用超球体将特征值转换成散列向量的技术,并且期望使用超球体的技术实现精度改善。
引用文献列表
专利文献
专利文献1:日本已公开专利公布第2011-100395号
专利文献2:日本已公开专利公布第2012-160047号
专利文献3:日本已公开专利公布第2011-39755号
非专利文献
非专利文献1:Jae-Pil Heo,Youngwoon Lee,Junfeng He,Shih-Fu Chang,andSung-Eui Yoon,“Spherical hashing”,in CVPR,pp.2957-2964,2012。
非专利文献2:Kengo Terasawa and Yuzuru Tanaka,“Spherical lsh forapproximate nearest neighbor search on unit hyper-sphere”,in FrankK.H.A.Dehne,Jorg-Rudiger Sack,and Norbert Zeh,editors,WADS,Vol.4619 ofLecture Notes in Computer Science,pp.27-38.Springer,2007。
然而,前述传统技术引起了利用超球体计算散列向量将导致计算量增加的问题。
此外,当利用超球体将特征向量转换成散列向量时,虫孔(wormhole)可以引起甚至明显不同的特征向量,从而在转换成散列向量后具有缩短的汉明距离。由于这个原因,那些不同的特征向量会被错误地确定为相似特征向量。
因此,本发明的一个实施例的一个方面的目的是提供一种以简单方式利用超球体实现要执行的相似性搜索的搜索方法、搜索程序以及搜索装置。
发明内容
根据实施例的一个方面,一种搜索方法包括:获取在数据库中存储的第一维特征向量;以及搜索以下参数:当特征向量基于包括交点和距离的所述参数映射在球体的表面上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的半球上,在该交点处特征空间与经过该球体的直线相交,,该球体存在于维度比该特征空间大一维或更多维的空间中,该距离是从球体的预定点至该特征空间的距离。
附图说明
图1是例示根据第一实施例的搜索装置的配置的功能块图。
图2A是例示特征值存储单元的示例数据结构的视图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410697191.1/2.html,转载请声明来源钻瓜专利网。