[发明专利]遗传性代谢病的预测装置有效
申请号: | 202210759620.8 | 申请日: | 2022-06-29 |
公开(公告)号: | CN115295145B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 马旭;曹宗富;殷哲 | 申请(专利权)人: | 国家卫生健康委科学技术研究所 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G16H10/60;G16B40/20 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 遗传性 谢病 预测 装置 | ||
本申请涉及一种遗传性代谢病的预测装置。主要技术方案包括:获取模块,用于获取待检测对象的血清小分子代谢物的待测数据,计算模块,用于计算待测数据中每种特征的贡献度值,筛选模块,用于按照每种特征的贡献度值从大到小的顺序,筛选出预设数量的贡献度值对应的特征为目标特征,预测模块,用于根据目标特征对应的待测数据,预测待测对象的病症信息,结合待测数据中的多种特征,充分考虑不同特征之间的相关影响,降低了假阳性率,提高了预测遗传性代谢病的准确率。
技术领域
本申请涉及医学信息技术领域,特别是涉及一种遗传性代谢病的预测装置。
背景技术
遗传性代谢病(Inherited Metabolic Disorders,IMD)又称先天性代谢缺陷,是由于编码物质代谢所必需的酶或者辅酶基因变异引起相应功能蛋白活性降低或丧失,从而导致机体代谢紊乱,造成中间、旁路代谢产物蓄积,或终末代谢产物缺乏,最终引发复杂的临床症状,常累及神经系统等多器官的一组疾病。
遗传性代谢病具有先天性、伴随终生的特点,并且遗传代谢病往往会对患儿的神经系统造成不可逆损伤,甚至危及生命。因此,针对遗传代谢病,必须及时筛查和诊断,否则难以在有限的时间内让患儿通过有效的治疗方法缓解相应的症状。
近年来,通过串联质谱技术检测小分子代谢物,被广泛应用于对新生儿遗传代谢病的筛查,极大地提高了临床医生发现遗传代谢病患儿的能力,有利于遗传代谢病患儿的早期检出。然而,目前对新生儿小分子代谢物检测数据的阳性判断假阳性率高,导致预测遗传性代谢病的准确率低。
发明内容
基于此,本申请提供了一种遗传性代谢病的预测装置,以提高预测遗传性代谢病的准确率。
第一方面,提供一种遗传性代谢病的预测方法,该方法包括:
获取待检测对象的血清小分子代谢物的待测数据;
计算待测数据中每种特征的贡献度值;
按照每种特征的贡献度值从大到小的顺序,筛选出预设数量的贡献度值对应的特征为目标特征;
根据目标特征对应的待测数据,预测待测对象的病症信息。
根据本申请实施例中一种可实现的方式,计算待测数据中每种特征的贡献度值,包括:
采用随机森林算法计算待测数据中每种特征所在随机森林中每个决策树的节点的第一Gini指数;
计算待测数据中每种特征所在决策树的节点进行分裂得到的两个新节点的第二Gini指数;
根据第一Gini指数、第二Gini指数和待测数据中每种特征所在每个决策树的全部节点,计算待测数据中每种特征在每个决策树的重要性评分;
根据重要性评分和随机森林中决策树的数量,计算待测数据中每种特征的贡献度值。
根据本申请实施例中一种可实现的方式,第一Gini指数采用以下公式计算得到:
其中,Ginim表示待测数据中特征j所在决策树的节点m的第一Gini指数,k表示特征分类的数量,pmk表示节点m在k个特征分类中出现的概率;
待测数据中特征j在第i个决策树的重要性评分采用以下公式计算得到:
其中,表示待测数据中特征j在第i个决策树的重要性评分,表示待测数据中特征j所在决策树的节点m的重要性评分,M表示待测数据中每种特征在随机森林中所有决策树的节点的集合;
其中,待测数据中特征j所在决策树的节点m的重要性评分采用以下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家卫生健康委科学技术研究所,未经国家卫生健康委科学技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210759620.8/2.html,转载请声明来源钻瓜专利网。