[发明专利]基于空间-语义-数值相关度的空间关键字Top-K查询方法有效
申请号: | 201910657221.9 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110362652B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 张霄雁;李盼;孙劲光;孟祥福;殷臣;杨昕悦;齐雪月;王丹丹 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/387;G06F40/30;G06F40/242 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 陈晓宁;张丽萍 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 语义 数值 相关 关键字 top 查询 方法 | ||
1.基于空间-语义-数值相关度的空间关键字Top-K查询方法,其特征在于,包括以下步骤:
步骤1:对于空间对象文本信息中的每个单词,生成其对应的词嵌入向量表示,然后计算出每对单词之间的语义相似度,存储在单词语义相似度表中,用于对查询关键字的语义扩展;
步骤2:构建AKR-tree混合索引结构,其具体步骤如下:步骤2.1:利用R-tree生成AKR-tree,AKR-tree每个节点的信息分为三个部分:前两部分是两个指针,分别指向包含该节点所有关键字的文件和数值属性文件,第三部分是该节点中的条目集合;
步骤2.2:生成AKR-tree各中间节点下空间对象数值属性元组的Skyline集合;
步骤2.2中数值属性元组的Skyline集合的生成规则如下:
假设AKR-tree中某个节点下的所有空间对象对应的数值属性元组集合D有n条元组和m+1个数值,令Α={A1,A2,...,Am},t[Ai]为元组t上属性Ai的值;
假设对于每个属性,在支配关系dominate中的值有一个偏序关系,一个元组t∈D支配另一个元组t’∈D,由表示,当且仅当t[Ai]≥t’[Ai]和t[Ai]t’[Ai];
如果一个元组t∈D与另一个元组t’∈D是不可比的,则表示为t~t’,当且仅当并且
步骤3:对于用户给定的空间关键字查询条件,先从步骤1中的语义相似度表中找出语义相关单词,扩展查询关键字范围;然后利用构建的AKR-tree混合索引进行查询结果快速匹配;
步骤4:在匹配过程中,先检查每个分支节点是否满足查询条件的空间约束,在满足空间约束的前提下,再检查该节点的Textfile中是否包含查询关键字;
对于匹配的节点,分别计算其Skyline集合中的空间对象与查询条件的位置相近度、语义相关度和数值接近度,最后得到匹配结果的综合得分,并按综合得分选出top-k个最终结果。
2.如权利要求1所述的基于空间-语义-数值相关度的空间关键字Top-K查询方法,其特征在于,步骤1的具体步骤如下:
步骤1.1:提取所有空间对象文本信息中的单词,进行去停用词处理,之后所有不同单词构成一个词典,对于词典中的每个不同单词,利用Word embedding技术生成每个单词的嵌入向量表示;
步骤1.2:基于单词的嵌入向量表示,利用Cosine相似度方法计算出每对单词之间的语义相似度,用于在线查询阶段的查询关键字语义扩展。
3.如权利要求1所述的基于空间-语义-数值相关度的空间关键字Top-K查询方法,其特征在于,步骤3的具体步骤如下:
步骤3.1:扩展空间关键字查询条件,利用AKR-tree得到与查询条件相匹配的节点,获得匹配节点中处于Skyline集合中的空间对象作为候选结果集合;
步骤3.2:对于候选结果集合中的每个空间对象,分别计算出其与查询的位置相近度、语义相关度以及数值接近度;
步骤3.3:计算出空间对象与查询的综合相关度分数,按分数大小选出top-k个最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910657221.9/1.html,转载请声明来源钻瓜专利网。