[发明专利]一种基于文本-域倒排的空间文本查询方法及装置有效

专利信息
申请号: 201810292840.8 申请日: 2018-04-04
公开(公告)号: CN108628950B 公开(公告)日: 2022-07-19
发明(设计)人: 沈兵林;贾连印;丁家满;游进国;李晓武;左喻灏;胡俊涛;雷妍 申请(专利权)人: 昆明理工大学
主分类号: G06F16/9537 分类号: G06F16/9537;G06F16/31
代理公司: 暂无信息 代理人: 暂无信息
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 域倒排 空间 查询 方法 装置
【权利要求书】:

1.一种基于文本-域倒排的空间文本查询方法,其特征在于:包括:

数据预处理步骤,将数据集D中所有位置点编码成长度为n的字符串,以该字符串为排序对象按字典序对数据集中的记录排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;

空间文本索引建立步骤,对记录集R中的文本建立倒排索引,倒排索引的列表元素为与字符串相对应的id列表,得到文本-域倒排索引结构;

布尔范围查询步骤,检索文本-域倒排索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回查询范围内的所有位置点;

所述数据预处理步骤,具体包括如下步骤:

步骤110:给定一个由一系列位置点、关键词集构成的数据集D,通过geohash空间编码方法将D中的位置点编码成长度为n的字符串geoStr;其中,位置点由纬度、经度数据构成;geoStr即geohash编码,表示geohash精度表中n对应的范围区域;

步骤120:以geoStr为排序对象按字典序对数据集中的记录排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;其中,记录r由id、纬度lat、经度lon、字符串geoStr、关键词集items组成,items至少包含一个关键词item;

所述空间文本索引建立步骤,具体为:

步骤210:对Ritems中每个独立元素关键词item,构建一个由rpart组成的倒排索引;其中,Ritems表示记录集R中全部关键词,rpart由item包含于r.items的r.id、r.geoStr组成,r.items表示记录r的关键词集,r.id表示记录r的id,r.geoStr表示记录r的字符串,Rpart表示由一至多行rpart组成的记录集,r∈R;

步骤220:对RpgStrs中每个独立元素geoStr,构建一个由rpart.geoStr等于geoStr的rpart.id组成的倒排列表;其中,RpgStrs表示Rpart中全部geoStr,rpart.geoStr表示rpart的字符串,rpart.id表示rpart的id,rpart∈Rpart

2.根据权利要求1所述的基于文本-域倒排的空间文本查询方法,其特征在于:所述布尔范围查询步骤,具体包括如下步骤:

步骤310:给定查询位置点q、查询距离范围d、查询关键词集qitems,根据geohash精度表选定与查询距离范围d相对应的geohash编码长度p,通过geohash空间编码方法将位置点q编码为p位长度的字符串qs,获取字符串qs周围8个区域的geohash编码,并将字符串qs及其周围8个区域的geohash编码分别作为查询域,共9个查询域;其中,p对应的距离误差不小于d且为最小值;qitems至少由一个关键词item构成;

步骤320:在文本-域倒排索引结构上快速获取满足查询条件的id;其中,查询条件指查找距离位置点q不大于d且包含全部qitems的id,即布尔范围查询;

步骤330:根据查询位置点q和查询距离范围d分别确定纬度范围与经度范围,根据经纬度范围对与步骤320返回的id相对应的位置点进行筛选,最终得到id候选集;

步骤340:计算候选集中id对应的位置点到查询位置点q的距离dq:若dq≤d,则返回该位置点,否则,不返回。

3.根据权利要求1所述的基于文本-域倒排的空间文本查询方法,其特征在于:所述步骤110,包括下列步骤111、112:

步骤111:根据geohash精度表确定geohash编码长度n;

步骤112:通过geohash空间编码方法将所有位置点编码成长度为n的字符串。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810292840.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top