[发明专利]一种用损失函数揭示孕期疾病和出生结局风险因素的方法在审
申请号: | 202110065207.7 | 申请日: | 2021-01-18 |
公开(公告)号: | CN114005534A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 花静;吴美琴;戴霄天;孙源瞳;郑唯韡;赵惠涓;何怡;马武仁;张超;李珣;王卓著;那炜;李智敏;容艳瑜;龙佳 | 申请(专利权)人: | 上海市第一妇婴保健院;复旦大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/50;G16H50/70;G06N20/00 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200040 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 损失 函数 揭示 孕期 疾病 出生 结局 风险 因素 方法 | ||
1.一种对预测变量的重要性进行研究的方法,其特征在于,所有预测变量均为分类变量,将其中某一预测变量移除后,采用损失增加百分比来描述该预测变量的重要性;
具体步骤包括:
(1)建立机器学习模型,利用所有预测变量对结局变量进行预测;
(2)运行模型,计算包含所有预测变量的模型损失值lossj;
(3)去掉其中一个预测变量,计算去掉该预测变量的模型损失值lossj-1;
(4)根据公式计算得到去掉该预测变量的损失增加百分比;
(5)重复步骤(3)和(4),计算出去掉每一个预测变量所对应的损失增加百分比,并进行从大到小排序,得到所有预测变量的重要性排序。
2.如权利要求1所述的一种对预测变量的重要性进行研究的方法,其特征在于,当所述结局变量为二分类结局变量时,包含所有预测变量的模型损失值lossj计算公式为,
去掉一个预测变量,模型损失值lossj-1计算公式为,
其中对数计算是以2为底,yi是结局变量,pi是根据所述机器学习模型计算得到的结局变量的预测概率,n是样本数量,j是预测变量的个数。
3.如权利要求1所述的一种对预测变量的重要性进行研究的方法,其特征在于,当结局变量为多分类结局变量时,包含所有预测变量的模型损失值lossj计算公式为:
去掉一个预测变量,模型损失值lossj-1计算公式为:
其中,对数计算是以2为底,yi,c是结局变量,pi,c是预测结局发生的概率,n是样本数量,c是结局变量的种类数,j是预测变量的个数。
4.如权利要求2或3所述的一种对预测变量的重要性进行研究的方法,其特征在于,
所述结局变量为出生结局变量,包括三种,分别是:(1)早产与足月,(2)新生儿Apgar得分低于7,Apgar评分大于或等于7,(3)新生儿出生体重,小于2500g为低出生体重,正常体重在2500g-4000g之间,大于4000g为巨大儿;
所有上述预测变量均为分类变量,具体包括以下几种:
(1)连续型整数变量:孕产妇年龄、孕次、孕次、胎儿数量均为连续型整数变量;
(2)三分类变量:职业为三分类变量,分别为公司职员、其他职业以及失业;
(3)二分类变量:
(A)民族:二分类变量,分为汉族和其他;
(B)引产、疤痕子宫、子宫切除、前置胎盘、胎盘早剥:分为有和没有;
(C)妊娠糖尿病、妊娠期高血压、先兆子痫、严重先兆子痫、发热、HELLP综合征、肾脏疾病:分为患病与不患病;
(D)胎儿性别:分为男性和女性;
(E)两次TSH联合诊断生化指标CTB:二分类变量,对CTB进行如下定义,如果孕前促甲状腺素TSH或者孕早期TSH水平有一次小于0.1mIU/L,则认为是低CTB,如果两次TSH水平均=0.1mIU/L,则视为正常。
5.一种用于预测出生结局的方法,其特征在于,预测变量包括两次TSH联合诊断生化指标CTB,CTB为二分类变量,如果孕妇在孕前TSH或者孕早期TSH水平有一次小于0.1mIU/L,则认为是低CTB,如果两次TSH水平均=0.1mIU/L,则视为正常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市第一妇婴保健院;复旦大学,未经上海市第一妇婴保健院;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110065207.7/1.html,转载请声明来源钻瓜专利网。