[发明专利]基于患者表征学习的用药推荐方法在审
申请号: | 202110406631.3 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113284627A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 朱振峰;徐慕豪;刘俊秀;葛欣宜 | 申请(专利权)人: | 北京交通大学;北京大学第三医院(北京大学第三临床医学院) |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H70/40;G06F16/33;G06F16/35;G06F40/289;G06K9/62 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 姜威 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 患者 表征 学习 用药 推荐 方法 | ||
1.一种基于患者表征学习的用药推荐方法,其特征在于,包括:
从电子病历中提取数据,所述数据包括非结构化的主诉文本信息和结构化的数据;
将所述数据中的非结构化的主诉文本信息表示为结构化的数据;
采用堆栈稀疏自编码器对结构化的数据进行表征学习,得到患者症状数据的低维表示的症状向量和用药信息数据的低维表示的用药向量;
使用聚类算法对患者症状数据的低维表示和用药信息数据的低维表示进行分析,得到各群体聚类内患者的症状特性和用药特性;
对各群体聚类内患者的症状特性和用药特性进行典型相关分析,得到各群体聚类内患者的症状特性和用药特性的关联关系;
根据所述的关联关系,采用加权距离平均的K近邻算法来预测推荐用药。
2.根据权利要求1所述的方法,其特征在于,所述的将所述数据中的非结构化的主诉文本信息表示为结构化的数据,包括:
对所述的非结构化的主诉文本信息进行分词:基于分词工具对所述的非结构化的主诉文本信息进行处理,计算词语间的互信息值,根据互信息值识别出主诉文本中的固定搭配词语,构建为自定义词典,从而完成主诉的分词工作;
对分词处理后的结果进行信息抽取:对分词处理后的词语与医院的症状库标准文本进行逐个比对,如果匹配,则直接完成抽取工作,如果不匹配,则基于搜索引擎的词语相似性计算方法搜索分词后的词语对应的症状词文本,得到结构化的数据。
3.根据权利要求2所述的方法,其特征在于,所述的基于搜索引擎的词语相似性计算方法搜索分词后的词语对应的症状词文本为基于百度搜索的词语相似性计算方法搜索分词后的词语对应的症状词文本,具体操作步骤如下:
对于处理后的词语p和症状库标准文本进q,Q为症状库中相关p文本的集合,使用爬虫获取两个词语分别和同时搜索时页面返回的搜索结果数量,记为N(p)、N(q)和N(p∩q);
按照下式(1)计算词语相的似性:
依次计算该词语p与Q中所有标准文本的相似度,如果对应最大的相似度超过第一设定阈值,则将p在对应的标准文本里,得到结构化的数据。
4.根据权利要求1所述的方法,其特征在于,所述的堆栈稀疏自编码器由两层简单自编码器连接而成,两层简单自编码器的隐藏层维度分别为8维和4维。
5.根据权利要求4所述的方法,其特征在于,所述的采用堆栈稀疏自编码器对结构化的数据进行表征学习,包括:
堆栈稀疏自编码器的损失函数为均方误差,并加入L2正则化项引入稀疏性限制,公式如下式(2)所示:
隐藏层激活函数采用下式(3)所示的Relu函数:
f(x)=max(0,x) (3)
重构层激活函数采用下式(4)所示的Softplus函数:
f(x)=log(1+ex) (4)
其中,J是模型的损失函数,xi是输入模型的第i个向量,N是输入数据的个数,f和g分别是自编码器中编码阶段和解码阶段的深度神经网络,α是正则化系数,w是模型中的各项参数。
6.根据权利要求1所述的方法,其特征在于,所述的使用聚类算法对患者症状数据的低维表示和用药信息数据的低维表示进行分析,得到各群体聚类内患者的症状特性和用药特性,包括:
以误差平方和SSE为核心指标,以所有患者的症状向量作为训练集,使用启发式的肘部法则来获得最优聚类簇数;
对患者症状数据低维表示的症状向量和用药信息数据低维表示的用药向量组合形成联合向量,将所有患者的联合向量作为一个聚类簇,然后用K-Means聚类算法将其分为两个聚类簇,计算两个簇的SSE值,对两个簇对应的SSE值中大的聚类簇继续使用K-Means算法划分为两个聚类簇,直至达到最优聚类簇数;
对得到的各聚类群体内患者的原始数据信息进行统计,获得各群体聚类内患者的症状特性和对应的用药特性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学;北京大学第三医院(北京大学第三临床医学院),未经北京交通大学;北京大学第三医院(北京大学第三临床医学院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110406631.3/1.html,转载请声明来源钻瓜专利网。