[发明专利]一种面向Top-k查询的查询结果即时多样化的方法有效
申请号: | 201710685831.0 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107688620B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 钟鸣;王赢 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多样化 算法 框架 tad 面向 top 查询 结果 即时 | ||
1.一种面向Top-k查询的查询结果即时多样化的方法,其特征在于,包括以下步骤:
步骤1:基于流式产生的查询结果,使用nextTop模块得到一个查询结果,将该查询结果加入到集合T中,nextTop模块的具体执行步骤包括:
步骤1.1:基于流式产生的查询结果,使用一个优先队列Que存储当前生成的查询结果,按照其对于查询的相关度从大到小在Que中依次排序;
步骤1.2:更新UpperBound值并判断Que中的第一个结果的相关度分数是否超过UpperBound,若超过了UpperBound,将其作为nextTop模块的结果返回,否则返回步骤1.1;
步骤2:动态的构建集合T的相似图,具体是当集合T中每加入一个新结果,就在对应的相似图中增加一个新节点和相关的边,该相似图的具体构建步骤包括:
步骤2.1:基于一定的相似性度量方法,计算新加入的结点与集合T中所有其他结点的相似度分数;
步骤2.2:若新结点与某个已有结点的相似性分数高过设定的阈值,则在两个结点之间增加一条边;
步骤3:在相似图上执行多样化算法DivSA,若能找到满足限制条件的多样化结果集则停止搜索,整个流程结束,否则返回步骤1,继续扩充集合T,该多样化算法DivSA是基于动态演化相似图上极大独立集进行,具体包括:
步骤3.1:定义集合Spre存储了前一个相似图的所有极大独立集,v为新加入相似图的结点,遍历所有的极大独立集I∈Spre,并逐一创建对应新集合I′=I∪v;若集合I中存在结点在相似图中邻接于结点v,则删除对应的I′中邻接于结点v的所有结点;若集合I中没有任何结点邻接于v,从Spre中删除I;将新的极大独立集I′加入到新集合Snew中,此集合用于保存新相似图的极大独立集;
步骤3.2:删除Snew中构成其他集合子集的集合;
步骤3.3:判断Snew中是否存在极大独立集其元素个数达到k,若存在一个极大独立集其元素个数达到k,那么便结束搜索,将此极大独立集作为多样化集返回,否则进入步骤3.4;
步骤3.4:Spre=Spre∪Snew,向集合T中加入一个新结点,返回到TAD的步骤1。
2.根据权利要求1所述的一种面向Top-k查询的查询结果即时多样化的方法,其特征在于,步骤3.2中删除其他集合子集的操作具体流程如下:
步骤3.2.1:将集合Snew中的元素按照其内部元素的数量从大到小排序;
步骤3.2.2:从大到小遍历Snew中的元素,对于每一个元素,比较它是否是其任意前序元素的子集,若是则删除此元素。
3.根据权利要求1所述的一种面向Top-k查询的查询结果即时多样化的方法,其特征在于,所述步骤3中,限制条件包括以下约束条件:
约束条件1:多样化结果集的大小为k,即包含k个查询结果;K为用户输入的想要返回的查询结果数量;
约束条件2:多样化结果集的元素之间互不相似;
约束条件3:在满足前两个条件的所有集合之中,选择集合中相关度最小的元素比其他集合中相关度最小的元素都具有更大相关度分数的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710685831.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种日志数据处理方法及装置
- 下一篇:一种文案的优化方法和系统