[发明专利]使用索引的信息检索系统和信息检索方法在审

专利信息
申请号: 201980012723.4 申请日: 2019-03-04
公开(公告)号: CN111699485A 公开(公告)日: 2020-09-22
发明(设计)人: 西村邦裕;青木贵司;竹内俊贵;赤部晃一 申请(专利权)人: 株式会社天空
主分类号: G06F16/951 分类号: G06F16/951;G06F40/247
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 周春燕;金玉兰
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 索引 信息 检索系统 检索 方法
【说明书】:

本发明是基于收集到的信息生成用于检索数据库的索引的装置。所述装置具备:辞典,其按每个特定的概念包含相互关联的多个短语;输入接口部,其接收文本的输入;文本处理部,其从所述文本切分出多个词语作为标记;有向图生成部,其生成表现了所述切分出的多个标记彼此的连接关系的有向图;有向图搜索部,其参照所述辞典在所述有向图内进行搜索,且在所述辞典中发现了搜索对象短语的情况下,展开所述有向图;以及索引生成部,其基于所述有向图内的多个标记生成索引。

技术领域

本发明涉及信息检索技术,尤其涉及用于基于所收集的信息生成用于对数据库进行检索的索引的装置和方法、以及用于执行该方法的程序。

背景技术

当前,提供有使用计算机系统的各种信息检索服务。例如,所谓的因特网检索是用于检索散布在因特网上的庞大信息(资源)的Web站点上的信息检索服务,典型地,服务提供者的被称为检索引擎的服务器程序基于用户给出的检索查询来进行索引检索,并向用户提供该检索的结果。在这样的信息检索服务中,典型地,检索引擎预先通过被称为爬行器(Crawler)的机器人代理巡回访问因特网上的Web页,并收集、分析所访问的Web页的信息,由此生成用于检索数据库的索引。当用户通过Web浏览器访问检索站点并输入希望检索的文本(检索查询)时,检索引擎分析检索查询而检索索引,并对基于预定的排名算法而提取出的结果进行评分,将按得分对这些提取出的结果进行排序所得的结果作为检索结果提供给用户。

由于这样的以往的索引型检索引擎预先根据由爬行器收集的信息直接生成索引,所以用户会得到仅基于被索引化的信息的检索结果。因此,例如,下述专利文献1提出了如下技术:根据索引基准对一个或一个以上的横断检索赋予索引,将查询与索引基准中的一个或一个以上的索引基准进行比较,使查询与索引基准匹配,并提供来自一个或一个以上的带索引横断检索的结果,该一个或一个以上的带索引横断检索与关于查询的索引基准相关联。

另一方面,下述专利文献2公开了一种机器翻译装置,该机器翻译装置为了得到高精度的译文,将原文划分成短语,并基于释义(paraphrase)信息获得与1个以上的各短语成对的释义,且使用1个以上的短语和1个以上的释义来获得包含短语集合的释义网格(Paraphrase Lattice)。

现有技术文献

专利文献

专利文献1:日本特开2015-133151号公报

专利文献2:日本特开2011-180823号公报

发明内容

技术问题

上述那样的信息检索服务深入地渗透到人们的一切社会活动之中,例如,在医疗领域也不例外。

例如,为了使新的治疗方法、药物的候选作为标准治疗被认可,需要实施临床试验,确认这样的治疗方法、药物的有效性和安全性等。典型地,医生等医疗工作者基于自身的专业知识,考虑治疗的内容、意义、副作用等所能设想的一切事项来制定临床试验计划。因此,医疗工作者在制定临床试验计划时,需要收集与被试验者的疾病相关联的各种信息(例如,病名、药名等),以免遗漏。例如,医疗工作者以关联信息为线索,从数据库系统提取其他临床试验的信息、学术论文等,并以此为基础确定实施步骤。

然而,作为实际问题,对于一个特定的概念,并不是唯一地被规定有一个特定的词语或表达(短语),通常,对于一个特定的概念,存在多个短语。特别是,在医疗领域这样的专业领域中,对于一个特定的概念,存在多个短语,特别是存在很多这些短语的近义词、同义词、关联词、缩略语以及外语、进而基于这些词语派生的派生词等(以下,分别称为“关联短语”,并将这些短语统称为“关联短语组”)。

因此,假设在医疗工作者基于偏颇的关联信息(本人通常未认识到该信息是偏颇的)检索数据库系统的情况下,有可能漏失合适的信息,由此,也有可能对临床试验计划的制定产生影响。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社天空,未经株式会社天空许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201980012723.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top