[发明专利]医学资料搜索方法、装置、电子装置及存储介质在审

专利信息
申请号: 202010917940.2 申请日: 2020-09-03
公开(公告)号: CN111984851A 公开(公告)日: 2020-11-24
发明(设计)人: 肖红丽 申请(专利权)人: 平安国际智慧城市科技股份有限公司
主分类号: G06F16/953 分类号: G06F16/953;G06F40/242;G06F40/289;G06F40/30;G16H50/70;G06K9/62;G06N3/04;G06N3/08
代理公司: 深圳市赛恩倍吉知识产权代理有限公司 44334 代理人: 迟珊珊;何春兰
地址: 518000 广东省深圳市前海深港合*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 医学 资料 搜索 方法 装置 电子 存储 介质
【权利要求书】:

1.一种医学资料搜索方法,其特征在于,所述方法包括:

接收用户输入的询问数据,其中,所述询问数据包括用户待询问的问题信息;

预处理所述询问数据,得到多个分词词项,其中,所述预处理包括中文分词处理和去除停用词处理;

输入所述多个分词词项至预先训练的医学疾病模型中,得到与医学相关的多个关键词;

计算所述多个关键词中每个关键词的词权重,输出多个词权重信息;

根据所述多个词权重信息从大至小排序,选取排在前面的预设个数词权重信息对应的关键词;及

基于选取的关键词在数据库中进行检索,得到检索结果。

2.如权利要求1所述的医学资料搜索方法,其特征在于,中文分词处理所述询问数据的方法包括:

基于结巴分词和统计词典构造前缀词典;

对所述查询数据进行词图扫描得到多个单独的子句,生成每个单独的子句对应的有向无环图;

采用动态规划在所述有向无环图中查找最大概率路径,找出基于词频的最大切分组合,得到多个分词词项。

3.如权利要求2所述的医学资料搜索方法,其特征在于,所述基于结巴分词和统计词典构造前缀词典包括:

定义第一字典,所述第一字典为空的python字典;

遍历统计词典的第一行,取词条作为所述第一字典的键,词频作为对应的键值;

遍历所述词条的前缀,如果所述词条的前缀对应的键不在所述第一字典里,设定所述词条的前缀为所述第一字典的键;

如果所述词条的前缀对应的键在所述第一字典里,继续遍历所述统计词典的下一行,直到遍历完所述统计词典中的最后一行,得到所述前缀词典。

4.如权利要求3所述的医学资料搜索方法,其特征在于,所述生成每个单独的子句对应的有向无环图包括:

定义第二字典,所述第二字典为空的python字典;

遍历所述多个单独的子句中的当前子句,当前子句元素的索引作为所述第二字典的一个键,对应的键值为一个python列表;

以所述索引作为子句的子串的起始索引,不断向后遍历生成不同的子串;

判断所述子串是否在所述前缀词典里且判断所述子串在所述前缀词典里的键值是否为零;

如果所述子串在前缀词典里且键值不为零,将所述子串的终止索引添加到所述python列表中;

当遍历完所述当前子句的所有子串之后,得到所述当前子句对应的有向无环图。

5.如权利要求1所述的医学资料搜索方法,其特征在于,通过多标签分类算法对所述医学疾病模型进行训练,包括:获取多个查询数据;

对每个查询数据中的一个或多个关键词进行标记;

基于标记了一个或多个关键词的查询数据及对应关键字的类别构建样本数据集;

将所述样本数据集随机分为第一数量的训练集和第二数量的测试集;

将所述训练集输入至卷积神经网络中进行训练,得到医学疾病模型;

将所述测试集输入至所述医学疾病模型中进行测试,得到测试通过率;

判断所述测试通过率是否大于预设通过率阈值;

当所述测试通过率大于或者等于所述预设通过率阈值时,结束医学疾病模型的训练;否则,当所述测试通过率小于所述预设通过率阈值时,增加所述训练集的数量并基于增加数量后的训练集训练卷积神经网络直至所述测试通过率大于或者等于所述预设通过率阈值。

6.如权利要求4所述的医学资料搜索方法,其特征在于,采用基于点击日志的方法计算所述多个关键词中每个关键词的权重,包括:

根据所述查询数据将所述多个关键词组合成多个子片段;

计算所述子片段中每个关键词的词权重和词丢弃概率;及

通过以下公式计算所述查询数据中的每个关键词的词权重;

其中,p(term|query)为所述查询数据中每个关键词的词权重,p(term|frag)为所述子片段中每个关键词的词权重,pvte(term|frag)为所述子片段中每个关键词的词丢弃概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010917940.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top