[发明专利]使用关系树的搜索工具在审
申请号: | 201980034266.9 | 申请日: | 2019-03-28 |
公开(公告)号: | CN112154430A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | D.P.史密斯 | 申请(专利权)人: | 伯耐沃伦人工智能科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张贵东 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 关系 搜索 工具 | ||
描述了一种用于确定相关的生物实体的系统。该系统包括:用户输入模块,被配置为接收包括生物实体的表示的搜索项;搜索模块,被配置为确定集合的哪些生物实体与搜索项的生物实体具有已知关联,具有已知关联的生物实体是结果,不具有已知关联的生物实体是非结果,其中集合的生物实体通过关系树中的亲子关系彼此相关;以及分析模块,被配置为通过识别在所述关系树中的边界内具有一个或多个结果的非结果来确定相关的生物实体。
本申请涉及一种在知识发现活动中使用关系树来支持用户以进行搜索的系统和计算机实现的方法。
背景技术
一系列字段中的知识发现者有兴趣从可用的知识集合中解密新信息。搜索引擎提供强大的信息检索工具,并且对于从公共领域和其他信息源检索已建立的事实和信息是理想的。典型地,以相关性的顺序在有序列表中呈现搜索结果,其中使用搜索算法来计算相关性。被认为是最相关的结果被呈现在列表的顶部,被认为较不相关的结果被进一步向下呈现。
搜索引擎生成数十页或数百页的搜索结果并不罕见。这给用户造成了信息过载的问题,并且用户具有以有意义的方式有效地筛选或过滤结果的有限方式。通过搜索算法计算的相关性的次序支配用户的治疗结果和与结果交互的方式,并且用户难以检测可能在结果页面中被淹没的模式或趋势。例如,如果显著结果出现在搜索结果的页面100上,则用户找到该显著结果是非常耗时的。用户也难以注意到页面100上的结果可能以潜在相关的方式与页面204上的结果相关。
这对试图从可用事实中辨别先前未知的信息如模式、趋势和关系的知识发现者提出了挑战。例如,在药物发现领域中,药物发现者可以使用搜索引擎来搜索与特定基因相关的疾病。所有熟知的与该基因相关的疾病可能在搜索结果列表的顶部被列为高度相关的。如果存在少量与该基因有关联但未被搜索算法确定为高度相关的疾病,则这些疾病可能出现在列表的更下方,使得药物发现者不太可能找到它们。此外,如果在列表下很远出现的两种疾病以潜在相关的方式彼此相关,特别是如果它们例如在10、204和506页展开时,药物发现者非常难以发现它们。
下面描述的实施例不限于解决上述已知方法的任何或所有缺点的实施方案。
发明内容
提供发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于确定所要求保护的主题的范围。
本发明提供了用于确定相关的生物实体以用于知识发现的目的的计算机实现的技术。
在第一方面,本发明提供了一种用于确定相关的生物实体的系统,所述系统包括:用户输入模块,被配置为接收包括生物实体的表示的搜索项;搜索模块,被配置为确定集合的哪些生物实体与搜索项的生物实体具有已知关联,具有已知关联的生物实体是结果,不具有已知关联的生物实体是非结果,其中集合的生物实体通过关系树中的亲子关系彼此相关;和分析模块,被配置为通过识别在所述关系树中的边界内具有一个或多个结果的非结果来确定相关生物实体。
优选地,所述一个或多个结果至少包括阈值数量的结果。
优选地,所述分析模块被配置为使用第一阈值定义用户输入来设置所述阈值数量的结果。
优选地,所述边界涵盖非结果的任何亲代、兄弟和子代。
优选地,所述边界涵盖所述非结果的任何孙代。
优选地,所述边界涵盖所述非结果的任何后代。
优选地,所述边界涵盖所述非结果的阈值树遍历距离内的任何生物实体。
优选地,使用边界定义用户输入来定义所述边界。
优选地,所述分析模块被配置为针对每个非结果计算分数。
优选地,对于每个非结果而言,边界内的结果越多,分数越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯耐沃伦人工智能科技有限公司,未经伯耐沃伦人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980034266.9/2.html,转载请声明来源钻瓜专利网。