[发明专利]医学模型的构建方法、疾病标签构建方法及智能设备有效
申请号: | 201811062782.6 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109243618B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 陈志刚;王万新;苏丽娟;孙继超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 模型 构建 方法 疾病 标签 智能 设备 | ||
1.一种医学模型的构建方法,其特征在于,包括:
为目标用户确定监督标签,并获取与所述目标用户的用户标识码关联的互联网数据,所述互联网数据包括所述目标用户浏览的文章数据、资讯数据以及搜索关键词中的任意一种或多种;
根据所述互联网数据确定所述目标用户的训练文本集;
从所述训练文本集中确定医学类关键词,并基于所述医学类关键词和所述监督标签优化第一初始模型,以得到第一模型,所述医学类关键词包括与预设疾病直接相关的专业名称;
获取所述训练文本集中包括的关联词,并基于所述关联词和所述监督标签优化第二初始模型,以得到第二模型,所述关联词包括与所述预设疾病直接相关的专业名称、术语和医疗类通用词;
根据所述得到的所述第一模型和所述第二模型构建疾病标签模型,所述疾病标签模型包括第一模型和第二模型。
2.如权利要求1所述的方法,其特征在于,所述监督标签包括用于标识目标疾病的疾病标签,所述从所述训练文本集中确定医学类关键词,并基于所述医学类关键词和所述监督标签优化第一初始模型,包括:
根据所述疾病标签确定医学类特征词集,所述医学类特征词集中包括与所述疾病标签所标识的目标疾病相关的医学类特征词;
基于所述医学类特征词集抽取所述训练文本集中包括的医学类关键词,并生成所述医学类关键词对应的医学类特征信息;
根据所述医学类特征信息和所述监督标签优化第一初始模型;
其中,所述医学类特征信息包括:医学类关键词及其对应的关键词特征值,所述关键词特征值用于表示所述医学类关键词在所述训练文本集中的重要等级。
3.如权利要求2所述的方法,其特征在于,所述根据所述医学类特征信息和所述监督标签优化第一初始模型,包括:
将所述医学类特征信息作为第一初始模型的输入参数,并获取所述第一初始模型输出的疾病识别结果;
若所述第一初始模型输出的疾病识别结果所指示的疾病与所述目标疾病不匹配,则优化所述第一初始模型。
4.如权利要求1所述的方法,其特征在于,所述获取所述训练文本集中包括的关联词,并基于所述关联词和所述监督标签优化第二初始模型,包括:
获取所述训练文本集的样本词特征集合;
对所述样本词特征集合进行筛选,得到关联词特征集合;
根据所述关联词特征集合和所述监督标签优化第二初始模型;
其中,关联词特征集合中包括关联词特征信息,所述关联词特征信息包括:关联词及其对应的关联词特征值,所述关联词特征值是根据关联词在对应的目标文本中的词频确定的。
5.如权利要求4所述的方法,其特征在于,所述对所述样本词特征集合进行筛选,得到关联词特征集合,包括:
对所述样本词特征集合进行初始筛选,得到筛选样本词集合;
将所述筛选样本词集合中的各个样本词按照在所述训练集中的重要等级进行排序,根据排序结果选择前N个样本词作为关联词,其中,N为大于1的正整数;
根据得到的关联词生成关联词特征集合。
6.如权利要求5所述的方法,其特征在于,所述对所述样本词特征集合进行初始筛选,包括:
删除第一类样本词和/或第二类样本词;
所述第一类样本词包括:在所述训练文本集中的词频大于第一词频阈值或者在所述训练文本集中出现的次数大于第一次数阈值的样本词;
所述第二类样本词包括:在所述训练文本集中的词频小于第二词频阈值或者在所述训练文本集中出现的次数小于第二次数阈值的样本词。
7.如权利要求4所述的方法,其特征在于,所述监督标签包括用于标识目标疾病的疾病标签,所述根据所述关联词特征集合和所述监督标签优化第二初始模型,包括:
将所述关联词特征集合中包括的关联词特征信息作为第二初始模型的输入参数,并获取所述第二初始模型输出的疾病识别结果;
若所述第二初始模型输出的疾病识别结果所指示的疾病与所述目标疾病不匹配,则优化所述第二初始模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811062782.6/1.html,转载请声明来源钻瓜专利网。