[发明专利]医学资料搜索方法、装置、电子装置及存储介质在审
申请号: | 202010917940.2 | 申请日: | 2020-09-03 |
公开(公告)号: | CN111984851A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 肖红丽 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/242;G06F40/289;G06F40/30;G16H50/70;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 迟珊珊;何春兰 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 资料 搜索 方法 装置 电子 存储 介质 | ||
本申请提供一种医学资料搜索方法,包括:接收用户输入的询问数据,其中,所述询问数据包括用户待询问的问题信息;预处理所述询问数据,得到多个分词词项,其中,所述预处理包括中文分词处理和去除停用词处理;输入所述多个分词词项至预先训练的医学疾病模型中,得到与医学相关的多个关键词;计算所述多个关键词中每个关键词的词权重,输出多个词权重信息;根据所述多个词权重信息从大至小排序,选取排在前面的预设个数词权重信息对应的关键词;及基于选取的关键词在数据库中进行检索,得到检索结果。本申请还提供一种医学资料搜索的装置、电子装置及存储介质。通过本申请可以快速搜索医学资料。
技术领域
本申请涉及人工智能技术领域,具体涉及一种医学资料搜索方法、装置、电子装置及存储介质。
背景技术
目前市场上有很多成功的医学产品,都拥有大量的医学文献和医学知识供病人、医学生、医生去查询以及学习使用。然而,传统的检索医学文献都是通过特定的关键词去检索对应的文献。知识库的内容数据越多,内容越丰富,响应的检索时间、准确性也会相对降低,并且耗费的成本也越高。即使检索出结果,还需要用户人为的通过自己的目的再次进行筛选,以达到找出更精准的、用户更想要的内容,这会大幅度的降低用户的体验度和兴趣。
发明内容
鉴于以上内容,有必要提出一种医学资料搜索方法、装置、电子装置及存储介质,可以快速检索医学资料。
本申请的第一方面提供一种医学资料搜索方法,所述方法包括:
接收用户输入的询问数据,其中,所述询问数据包括用户待询问的问题信息;
预处理所述询问数据,得到多个分词词项,其中,所述预处理包括中文分词处理和去除停用词处理;
输入所述多个分词词项至预先训练的医学疾病模型中,得到与医学相关的多个关键词;
计算所述多个关键词中每个关键词的词权重,输出多个词权重信息;
根据所述多个词权重信息从大至小排序,选取排在前面的预设个数词权重信息对应的关键词;及
基于选取的关键词在数据库中进行检索,得到检索结果。
根据本申请一些实施方式,中文分词处理所述询问数据的方法包括:
基于结巴分词和统计词典构造前缀词典;
对所述查询数据进行词图扫描得到多个单独的子句,生成每个单独的子句对应的有向无环图;
采用动态规划在所述有向无环图中查找最大概率路径,找出基于词频的最大切分组合,得到多个分词词项。
根据本申请一些实施方式,所述基于结巴分词和统计词典构造前缀词典包括:
定义第一字典,所述第一字典为空的python字典;
遍历统计词典的第一行,取词条作为所述第一字典的键,词频作为对应的键值;
遍历所述词条的前缀,如果所述词条的前缀对应的键不在所述第一字典里,设定所述词条的前缀为所述第一字典的键;
如果所述词条的前缀对应的键在所述第一字典里,继续遍历所述统计词典的下一行,直到遍历完所述统计词典中的最后一行,得到所述前缀词典。
根据本申请一些实施方式,所述生成每个单独的子句对应的有向无环图包括:
定义第二字典,所述第二字典为空的python字典;
遍历所述多个单独的子句中的当前子句,当前子句元素的索引作为所述第二字典的一个键,对应的键值为一个python列表;
以所述索引作为子句的子串的起始索引,不断向后遍历生成不同的子串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010917940.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:医学信息查询方法、装置、电子设备及介质
- 下一篇:LED驱动模组和照明灯具