[发明专利]基于语义轨迹大数据的反向最近邻查询方法及装置有效
申请号: | 201811276801.5 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109492150B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 潘晓;吴雷 | 申请(专利权)人: | 石家庄铁道大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/9536;G06F16/31;G06F16/33;G06Q50/00 |
代理公司: | 石家庄国为知识产权事务所 13120 | 代理人: | 李荣文 |
地址: | 050043 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 轨迹 数据 反向 近邻 查询 方法 装置 | ||
本发明适用于通信技术领域,提供了一种基于语义轨迹大数据的反向最近邻查询方法及装置,其中方法包括:根据轨迹数据集建立轨迹索引IMC树,其中,所述IMC树包括倒排列表与多个MC树,所述倒排列表用于存储关键字词汇表,所述MC树包括用于存储轨迹局部位置的轨迹摘要;根据查询数据集建立查询索引WIBR树;通过对IMC树与WIBR树进行交替访问,确定查询q的查询结果rnnk(q),所述查询结果为所述IMC树中将查询q作为最近邻查询的最小相关子轨迹。本发明提供的一种基于语义轨迹大数据的反向最近邻查询方法及装置,能够实现语义轨迹上的反向最近邻查询并能够得到更加具体确切的查询结果。
技术领域
本发明属于通信技术领域,尤其涉及一种基于语义轨迹大数据的反向最近邻查询方法及装置。
背景技术
随着移动设备和社交网络普及和应用,产生了大量富含语义的轨迹数据(即语义轨迹)。语义轨迹包括一些列空间文本点,每个空间文本点包括空间位置以及关键词集合。所述关键词集合为该空间文本点的语义标签。由于语义轨迹中蕴含丰富的知识,语义轨迹检索已经引起了商业组织和研究机构的高度关注。关于语义轨迹检索的现有研究中主要关注K最近邻查询(kNN,k-NearestNeighbor)。反向最近邻查询作为重要查询类型之一,在语义轨迹上的相关研究上并未引起足够的重视。在语义轨迹上的反向k最近邻查询(RkNNST,Reverse k-Nearest Neighbor)是查找那些将查询q作为其K最近邻查询结果之一的语义轨迹的集合。
RkNNST对许多应用具有重要意义,如本地推荐,新站点选择,影响集的发现等。以旅游导游推荐为例,每位导游都各有擅长的领域(即标签),如宗教文化,自然美景,购物消费等。每个景点也都具有自己相应的特征。旅客可以事先指定预期的访问路线。导游希望找到那些将自己视为预进行或正在进行的旅游路线最佳导游选择的路线主人(即游客)。“最佳导游选择”是指该导游是这些景点的专家,且距离路线主人最近。另一个RkNNST应用实例是确定新购物中心的位置。每个用户拥有一条消费轨迹。轨迹上的每个位置与用户购买的消费品关联。投资者想知道一个新选址的购物中心是否能最大限度地满足消费者在购买品种和空间邻近性方面的需求。
为了使RkNNST的查询结果更加具体确切,在语义轨迹上进行RkNNST查询时,将与查询q的关键词相关的语义轨迹的子轨迹集合作为查询结果,需要同时考虑轨迹中对应全部空间文本点的全局信息和对应每个空间文本点的局部信息,才能得到准确具体的查询结果。然而,现有技术中对语义轨迹的空间索引,例如STR-tree,MV3R-tree,MTSB-tree关注的仅是全局空间特征,空间文本索引如IR树和I3仅考虑的是空间文本对象的快照位置,不能满足在语义轨迹上实现RkNNST的需求。
发明内容
本发明实施例提供了一种基于语义轨迹大数据的反向最近邻查询方法及装置,能够实现同时考虑轨迹中对应全部空间文本点的全局信息和对应每个空间文本点的局部信息,进而实现对语义轨迹的最近邻查询。
本发明实施例的第一方面,提供了一种基于语义轨迹大数据的反向最近邻查询方法,包括:
根据轨迹数据集建立轨迹索引IMC树,其中,所述IMC树包括倒排列表与多个MC树,所述倒排列表用于存储关键字词汇表,所述关键字词汇表根据轨迹数据集中各轨迹包括的关键字生成,每个MC树与所述关键字词汇表中的每个关键字一一对应建立,所述MC树包括用于存储轨迹局部位置的轨迹摘要;
根据查询数据集建立查询索引WIBR树;
通过对IMC树与WIBR树进行交替访问,并且在访问过程中根据IMC树中的节点与WIBR树中的节点之间的距离边界,对IMC树中的节点与WIBR树中的节点进行修剪,确定查询q的查询结果rnnk(q),所述查询结果为所述IMC树中将查询q作为最近邻查询的最小相关子轨迹。
本发明实施例的第二方面,提供了一种基于语义轨迹大数据的反向最近邻查询装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811276801.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置