[发明专利]基于人工智能的预测分类模型获取方法及装置、存储介质有效
申请号: | 201910759287.9 | 申请日: | 2019-03-08 |
公开(公告)号: | CN110490251B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 刘续乐;杨巍;孙钟前;胡海峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G16H50/20;G16H50/70 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 预测 分类 模型 获取 方法 装置 存储 介质 | ||
1.一种基于人工智能的预测分类模型获取方法,其特征在于,包括:
从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;所述训练样本中的正负样本的配置比例为预设的配置比例;
获取与所述训练样本对应的病症的预设疾病相关文本信息;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;所述预设疾病相关文本信息是对不同网站所记载的文字描述进行互相校验之后得到的;
调用设置的训练模型处理所述训练样本和预设疾病相关文本信息,得到训练结果;
基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,所述预测分类模型表征病历数据与疾病分类的对应关系;
利用所述预测分类模型,对所述预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;所述疾病文本特征包括至少两种疾病对应的至少两个疾病文本子特征;
对所述至少两个疾病文本子特征和所述病历数据特征进行相似度计算,得到至少两个疾病相似度特征;
对所述至少两个疾病相似度特征进行归一化处理,得到与所述至少两个疾病相似度特征一一对应的至少两个权重系数;
采用注意力机制算法,对所述至少两个疾病文本子特征、所述至少两个权重系数和所述病历数据特征进行特征融合,得到至少两种疾病对应的融合特征;
基于所述融合特征进行分类处理,得到分类结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,包括:
根据所述训练结果、所述训练样本和预设损失函数确定误差值;
当所述误差值在预设阈值范围内时,确定所述训练模型收敛;
当所述误差值未在预设阈值范围内时,调整所述训练模型中的模型参数,直至所述误差值达到所述预设阈值范围为止,确定所述训练模型收敛;
将收敛的训练模型作为所述预测分类模型。
3.根据权利要求1或2所述的方法,其特征在于,所述训练模型中包含输入层、编码层、知识融合层和全连接层;所述调用设置的训练模型处理所述训练样本和预设疾病相关文本信息,得到训练结果,包括:
通过所述输入层将所述训练样本和所述预设疾病相关文本信息传输至编码层,进行对文字型数据的长短期记忆网络LSTM编码,以及对数值型数据的卷积神经网络CNN编码,得到预设疾病文本特征和历史病历数据特征;
将所述预设疾病文本特征和所述历史病历数据特征在知识融合层拼接后,得到训练融合特征;
采用训练融合特征传输至所述全连接层,得到最后的训练结果。
4.根据权利要求1所述的方法,其特征在于,
所述预设疾病相关文本信息包括:多种疾病症状描述文字信息和对应的易患人群信息;
所述历史病历数据包括:历史病史数据、历史体征检查数据、历史检验数据或历史患者信息中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910759287.9/1.html,转载请声明来源钻瓜专利网。