[发明专利]一种融合贝叶斯网络与回归分析的治疗费用预测方法在审
申请号: | 202110108182.4 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112802567A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 谷金波;李晶皎;闫爱云;金硕巍;王爱侠;李贞妮 | 申请(专利权)人: | 东北大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06Q10/04;G06Q10/06;G06Q30/02;G06K9/62 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 贝叶斯 网络 回归 分析 治疗 费用 预测 方法 | ||
1.一种融合贝叶斯网络与回归分析的治疗费用预测方法,其特征在于:包括下述步骤:
步骤1:获取初始电子病历数据集
步骤1.1:获取确诊为预设疾病的多份历史电子病历;
步骤1.2:确定与预设疾病相关的评价指标;
步骤1.3:从每份历史电子病历中抓取与预设疾病相关的评价指标数据、治疗方案类型数据、治疗费用数据;所述治疗方案分为3类,第1、2、3类治疗方案分别为药物治疗、放化疗、手术,所述治疗费用为检查费用、药物费用、手术费用的总和,所述药物费用包括治疗药物费用、放化疗药物费用;
步骤1.4:对每份历史电子病历中的描述型评价指标进行数值化处理,得到初始电子病历数据集;每份初始电子病历数据包括与预设疾病相关的数值型评价指标数据、数值化处理后的描述型评价指标数据、治疗方案类型数据、治疗费用数据;
步骤2:分析数据缺失程度,对部分缺失变量插值
步骤2.1:对初始电子病历数据集进行筛选:计算每份初始电子病历数据中评价指标数据的缺失率,删除缺失率超过20%的电子病历数据,得到筛选后的电子病历数据集;其中,缺失率为每份初始电子病历数据中缺失的评价指标数据个数占评价指标总个数的比值;
步骤2.2:对筛选后的电子病历数据集中缺失值进行插值处理,得到插值处理后的电子病历数据集A={(A1,p1,c1),(A2,p2,c2),...,(Am,pm,cm),...,(AM,pM,cM)};其中,(Am,pm,cm)为第m份插值处理后的电子病历数据,m=1,2,...,M,M为插值处理后的电子病历数据总份数,Am={am1,am2,...,amn,...,amN},amn为第m份插值处理后的电子病历数据中第n个评价指标的值,n=1,2,...,N,N为评价指标总数,pm为第m份插值处理后的电子病历数据中的治疗方案类型值,cm为第m份插值处理后的电子病历数据中的治疗费用值;
步骤3:构建基于高斯贝叶斯网络的治疗方案分类模型
步骤3.1:对数据集A中的各评价指标进行相关性分析,删除每两个有直接关系的评价指标中的一个,得到训练数据集A';
步骤3.2:利用训练数据集A'中的评价指标数据与治疗方案类型数据,构建并训练基于高斯贝叶斯网络的治疗方案分类模型;
步骤4:构建基于回归分析的类内治疗费用预测模型
对于每个治疗方案类型,利用训练数据集A'中该治疗方案类型下的评价指标数据与治疗费用数据,构建并训练该治疗方案类型下基于回归分析的治疗费用预测模型;
步骤5:对确诊为预设疾病的病人的治疗费用进行预测
步骤5.1:获取确诊为预设疾病的病人的电子病历,采用与步骤1.3中相同的方法抓取该病人的电子病历中与预设疾病相关的评价指标数据,采用与步骤1.4中相同的方法对该病人的评价指标数据中描述型评价指标进行数值化处理,得到该病人的数值化处理后的评价指标数据;
步骤5.2:若该病人的数值化处理后的评价指标数据存在缺失值,则采用与步骤2.2中相同的插值处理方法,利用数据集A中的评价指标数据对该病人的数值化处理后的评价指标数据进行插值处理,得到该病人的插值处理后的评价指标数据;
步骤5.3:根据步骤3.1中相关性分析确定删除的评价指标,删除该病人的插值处理后的评价指标数据中对应的评价指标数据,将剩余的评价指标数据输入训练后的治疗方案分类模型,得到该病人的治疗方案类型;将剩余的评价指标数据输入该病人的治疗方案类型下的治疗费用预测模型,输出该病人的治疗费用预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110108182.4/1.html,转载请声明来源钻瓜专利网。