[发明专利]一种骨科搜索引擎系统在审
申请号: | 202010690593.4 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111984694A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 刘峥嵘;王岩;张国强;孟齐源;许可;苏轩 | 申请(专利权)人: | 北京欧应信息技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/248;G06F16/31;G06F16/36 |
代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 黄淑娟 |
地址: | 100020 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 骨科 搜索引擎 系统 | ||
本发明公开了一种骨科搜索引擎系统,所述骨科搜索引擎系统包括:数据挖掘模块、知识图谱建库模块、搜索引擎建库模块、搜索引擎;所述数据挖掘模块,用于从骨科数据资源中获取骨科实体信息以及所述骨科实体信息之间的关系信息,并获得标准化的骨科实体信息和关联信息;所述知识图谱建库模块,用于根据所述骨科实体信息和所述关系信息,建立并存储骨科知识图谱;所述搜索引擎建库模块,用于对所述骨科数据资源中的数字文档进行搜索索引的建库,生成索引数据;所述搜索引擎,用于响应用户的检索内容,并根据所述检索内容,展现检索结果。本发明提供的搜索引擎系统能够快速、高效地实现点到面的骨科知识搜索。
技术领域
本发明属于数据处理技术领域,具体地说,涉及一种骨科搜索引擎系统。
背景技术
医学领域有大量的病例、文献、视频等资料。这些资料中涉及到很多的医学知识点,例如:疾病、症状、手术、器械等。医学工作者、患者、家属等人群需要经常搜索这些资料,而提供这一服务的最常见形式就是搜索引擎。目前的医学领域资料检索,主要采用以下两种传统的搜索方式:
第一种,将文档数据保存在结构数据库(例如:MySql数据库)中,通过SQL语句进行数据库的精确/模糊匹配(例如正文包含指定文字的文档,作者为指定文字的文档等),实现文档的搜索。
这种方式只能实现最基本的查询匹配功能,无法支持复杂的查询。例如:用户搜索“膝关节置换手术”时,采用这种方式进行数据库匹配,无法匹配“膝关节置换术”的结果。此外,这种方式也无法实现query纠错/同义词等效果。例如:“THA”是“全髋关节置换术”的别名,但是使用“THA”进行数据库检索,无法检索出“全髋关节置换术”的结果。这种方式不仅检索效果差,还非常耗时,无法适用于高并发低延迟的应用场合。
第二种,基于倒排索引的搜索技术。即事先对需要检索的文档信息进行文字的倒排索引建库。倒排索引会记录每个关键字出现在哪些文档中。用户进行内容搜索的时候,输入的搜索文档首先经过分词,得到基本的token(最小粒度的词),然后在倒排索引中寻找这些token出现在哪些文档中,然后通过相关性算法计算每个文档的字面相关性,排序得到最终的搜索结果。
这种方式能够较好的解决第一种方法存在的问题,因此被广泛应用于复杂的搜索场景。但是,单纯的搜索引擎只能解决从搜索query到匹配文档的过程,即:搜什么给什么。这是一种点到点的搜索模式。而在医学领域,很多搜索场景下更倾向于是一种点到面的搜索。我们常遇到的场景是这样的:用户搜索“膝骨关节炎”,除了想要了解上述疾病本身的资料,还要了解这个疾病常见的症状、治疗方法和每种治疗方法的风险等信息。而这种倒排索引的搜索技术无法一次性给出用户所需的资料,需要用户发起多次搜索才能够获取全部资料。因此,这种方式不利于医学领域的知识查询和获取。
综上所述,目前并没有一种适用于医学领域的、高效、快速的知识查询和搜索技术。
发明内容
本发明为了克服现有技术中存在的缺陷,将传统搜索引擎技术与知识图谱技术、数据挖掘技术相结合,提出了一种从原始医学资源中自动挖掘知识数据,然后建立知识图谱数据,最后在搜索引擎中与知识图谱进行搜索结果联动,从而实现从点到面搜索效果的解决方案。
根据本发明的一个方面,提供一种骨科搜索引擎系统,所述骨科搜索引擎系统包括:
数据挖掘模块、知识图谱建库模块、搜索引擎建库模块、搜索引擎;
所述数据挖掘模块,用于从骨科数据资源中获取骨科实体信息以及所述骨科实体信息之间的关系信息,并获得标准化的骨科实体信息和关联信息;
所述知识图谱建库模块,用于根据所述骨科实体信息和所述关系信息,建立并存储骨科知识图谱;
所述搜索引擎建库模块,用于对所述骨科数据资源中的数字文档进行搜索索引的建库,生成索引数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧应信息技术有限公司,未经北京欧应信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010690593.4/2.html,转载请声明来源钻瓜专利网。