[发明专利]一种用于先心病手术患儿术后远期营养不良的预测模型的构建方法有效
申请号: | 202110521561.6 | 申请日: | 2021-05-13 |
公开(公告)号: | CN113140320B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 崔彦芹;刘翔;石慧;胡春梅;李莉;张琳 | 申请(专利权)人: | 广州市妇女儿童医疗中心;广州知汇云科技有限公司 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16H20/60 |
代理公司: | 广东兴邦华腾专利代理事务所(特殊普通合伙) 44547 | 代理人: | 张树峰;梁凤德 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 心病 手术 术后 远期 营养不良 预测 模型 构建 方法 | ||
1.一种用于先心病手术患儿术后远期营养不良的预测模型的构建方法,其特征在于,包括以下步骤:
选取术前体格指标和术后体格指标已知的患儿,并随机分为建模组和测试组;
获取患儿的前体格指标、手术诊断、左室射血分数、手术年龄、住院天数、喂养信息,将手术诊断和喂养信息转换成哑变量,并对体格指标、左室射血分数、手术年龄和住院天数进行中心化处理;
将患儿的营养不良状态作为因变量,以中心化的体格指标、左室射血分数、手术年龄和住院天数作为自变量,建立拟合随机森林、支持向量机、Gradient Boosting Machine、XGboost、人工神经网络和逻辑回归的模型;
采用五折交叉验证结合Grid-Search方法寻找,并经soft voting算法进行集成,求得集成模型;
所述XGboost的模型构建过程如下:
给定含有n个样本和m个特征的数据空间D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R);
所述n表示样本个数;所述m表示患者信息的特征数量;所述R表示实数集,Rm表示m维实数空间,xi表示第i个样本,yi表示第i个样本的标签;
构建Ensemble的树模型,其表达式为:
其中,表示模型的输出结果,fk表示第k个树模型,表示所有树模型构成的空间;
在Ensemble的树模型的目标函数中添加惩罚项,其表达式为:
其中,表示损失函数,表示目标函数,Ω(fk)表示惩罚项,惩罚项表达式为:
其中,γ表示树模型数量的惩罚系数,T表示树模型fk的叶子个数,w表示树模型的预测结果,λ表示树模型的预测结果w对应的惩罚系数;
对添加惩罚项的Ensemble的树模型进行逐步训练,其表达为:
其中,t表示当前的步数,表示第t-1步的树模型预测结果,ft(xi)表示当前的树模型,Ω(ft)表示当前树模型对应的惩罚项,l函数代表损失函数;
利用二阶展开近似逼近原目标函数,其表达式为:
其中,gi和hi分别表示损失函数的一阶导数和二阶导数;
优化并去掉常数项,其表达式为:
预设Ij={iq(xi)=j}为数据空间的第j个叶子的事件集,q(xi)表示输入样本xi经过树模型的分叉进入到第j个叶子的映射;对公式(6)进行优化:
其中,wj表达第j个叶子的权重值,T表示树模型fk的叶子个数,γ表示树模型数量的惩罚系数;
求得任一叶子的最优权重值,其表达式为:
根据贪婪算法求得任一次分叉后的损失函数,其表达式为:
其中,IL表示树模型中分叉的左边的事件集,IR表示树模型中分叉的右边的事件集,I表示树模型在展开新的节点之前的总事件集合;
采用五折交叉验证结合Grid-Search方法寻找最优化参数,并经soft voting算法进行集成,求得集成模型。
2.根据权利要求1所述的一种用于先心病手术患儿术后远期营养不良的预测模型的构建方法,其特征在于,所述随机森林的模型为多个随机数的bagging模型。
3.根据权利要求1所述的一种用于先心病手术患儿术后远期营养不良的预测模型的构建方法,其特征在于,所述人工神经网络采用2个隐含层,且任一隐含层采用50个神经元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市妇女儿童医疗中心;广州知汇云科技有限公司,未经广州市妇女儿童医疗中心;广州知汇云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110521561.6/1.html,转载请声明来源钻瓜专利网。