[发明专利]基于倒排技术的快速检索方法无效
申请号: | 201110110118.6 | 申请日: | 2011-04-29 |
公开(公告)号: | CN102201001A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 廖开阳;刘贵忠;肖莉;惠有师;南楠;王喆 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陆万寿 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 技术 快速 检索 方法 | ||
1.基于倒排技术的快速检索方法,其特征在于,包括以下步骤:
根据量化表,应用几何一致性,在倒排表中取出对应中心满足要求的所有数据,形成数据集A;在量化表内逐个取出中心数,并在倒排表内找到这个中心所在倒排项的起始位置,逐个取出当前中心所对应的所有倒排项,满足规定的几何一致性,放入数据集A中;
应用基于数组的桶排序方法,快速排序统计数据集A中数据的顺序及出现次数,获得数据集B;
根据内容一致性计算匹配率,滤出干扰数据,获得数据集C;
根据精度要求在数据集C中快速查找最优集D,作为输出结果。
2.根据权利要求1所述的方法,其特征在于,所述倒排表是一个词汇到出现过该词汇的所有文本、图像或视频帧位置的映射,以及关于这个词汇的方向、位置和尺度信息。
3.根据权利要求1所述的方法,其特征在于,所述量化表是每个词汇在倒排表中对应中心位置和关于这个词汇的方向、位置和尺度信息。
4.根据权利要求1所述的方法,其特征在于,所述几何一致性是指待查找内容与目标内容在局部具有空间几何一致性的属性,应用这一属性可以对查询的结果进行筛选。
5.根据权利要求1所述的方法,其特征在于,所述应用基于数组的桶排序方法,快速排序统计数据集A中数据的顺序及出现次数,包括下列步骤:
建立一个按顺序排列的桶,根据目标数据的序号信息,建立一个数组,初始化为0,每个数组元素的下标对应着目标数据的一个序号,这个数组根据目标数据的序号信息可以是一维、二维或多维,把每一个数组元素看成一个桶,就建立了一个按顺序排列的桶;
把数据集A中数据分入桶中,根据数据集A中数据的序号信息,把每个数据分入对应桶中,即对应下标的数组元素增1,获得了一个有序的统计集合,即数据集B。
6.根据权利要求1所述的方法,其特征在于,所述内容一致性是指待查找内容与目标内容在内容上具有相似性的属性,这样提取出的特征点数应该比较接近,应用这一属性对查询的结果进行筛选。
7.根据权利要求1所述的方法,其特征在于,所述根据内容一致性计算匹配率,滤出干扰数据,获得数据集C,包括下列步骤:
找出数据集B中大于0的数组元素,该数组元素的值为匹配点数,即以这个元素下标为序号的目标项和查询项的特征匹配上的点数;
根据匹配点数、查询项和目标项的总特征点数,求得匹配率,先比较查询项总特征点数、目标项的总特征点数哪个大,然后用匹配点数除以较大的总特征点数得到匹配率;
找出数据集B中匹配率大于域值t的所有比值,放入数据集C中。
8.根据权利要求1所述的方法,其特征在于,所述根据精度要求在数据集C中快速查找最优集D,作为输出结果,根据匹配率高说明匹配效果好这一事实,在数据集C中快速查找匹配率最高的前m项,形成最优集D,其中m代表精度,决定最优集的范围。
9.根据权利要求7所述的方法,其特征在于,所述快速查找是指建立一个具有m项的有序单向链表L,扫描数据集C中的数据,如果找到一个数比链表L中最小的数大则插入链表L中,同时在链表L中删除最小的数,利用链表结构的快速插入和删除的特性,一次循环即可找到匹配率最高的前m项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110110118.6/1.html,转载请声明来源钻瓜专利网。