[发明专利]诊断HCM的装置、预测HCM患者预后的装置在审
申请号: | 202210226696.4 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114628026A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 胡泽平;汪文敏;宋雷;王继征 | 申请(专利权)人: | 清华大学;中国医学科学院阜外医院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06K9/62;G01N33/68 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张贵东 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诊断 hcm 装置 预测 患者 预后 | ||
1.一种诊断肥厚型心肌病(HCM)的装置,包括:
数据获取单元,配置为获取包括多个正常人的血液样本的样本数据和多个HCM患者的血液样本的样本数据作为第一训练数据集,所述第一训练数据集包括第一数量个样本数据,并且所述样本数据的每个包括第二数量种类的代谢物的丰度数据;
诊断模型构造单元,包括:
特征筛选单元,配置为利用套索回归算法对所述第一训练数据集执行降维处理以获得第二训练数据集,所述第二训练数据包括第一数量个降维样本数据,并且所述降维样本数据的每个包括从所述第二数量种类的代谢物中筛选出的第三数量种类的一组特征代谢物的丰度数据;
模型构造单元,配置为利用随机森林算法,使用所述第二训练数据集训练多个决策树来构造随机森林模型作为HCM诊断模型;以及
诊断单元,配置为使用构造的HCM诊断模型获得指示用户是否患有HCM的诊断结果。
2.如权利要求1所述的装置,其中所述特征筛选单元进一步配置为通过设置套索回归算法中的正则化系数,确定样本数据中的第二数量种类的代谢物各自对应的特征系数,以及
确定特征系数不为零的代谢物作为所述第三数量种类的一组特征代谢物,以获得包括第三数量种类的一组特征代谢物的丰度数据的降维样本数据作为第二训练数据集。
3.如权利要求2所述的装置,其中所述正则化系数设置为0.001,并且所述第三数量种类的一组特征代谢物为五种特征代谢物,包括次黄嘌呤、色氨酸、8:0-肉碱、苯丙氨酸以及肌酸。
4.如权利要求3所述的装置,其中所述模型构造单元进一步配置为在所述第二训练数据集中,通过每次随机选择一个样本数据的方式,有放回地选择第一数量个样本数据用于训练一棵决策树,
通过自助法重采样方式重复多次训练获得第四数量棵的决策树,以及利用所述第四数量棵的决策树形成随机森林模型作为HCM诊断模型,其中所述HCM诊断模型评估所有决策树的决策结果,并基于多数原则输出最终的诊断结果。
5.如权利要求4所述的装置,其中所述模型构造单元进一步配置为针对每一棵决策树,有放回地选择第一数量个样本数据作为决策树的根节点处的样本,
在决策树的每个节点需要分裂时,随机从所述五种代谢物中选取出m个代谢物,m是小于等于5的整数,并且选择使得节点基尼系数最小的代谢物作为决策树的节点的分裂条件,
根据选择的一组特征代谢物对每一个节点执行分裂操作,使得每个子节点包括样本数据的一部分,重复执行分裂操作直到决策树的每个子节点只存在一种类别。
6.如权利要求1-5的任一所述的装置,其中,所述数据获取单元进一步配置为获取多个用户的血液样本的样本数据作为测试数据集,以及
所述诊断模型构造单元进一步包括模型测试单元,配置为使用所述测试数据集测试构造的HCM诊断模型,以评估所述HCM诊断模型在独立数据集上的准确性。
7.如权利要求3-5的任一所述的装置,其中所述数据获取单元包括试剂盒,配置为获取一个或多个诊断用户的血液样本中的五种特征代谢物的丰度数据,
所述诊断单元进一步配置为将用户的五种特征代谢物的丰度数据输入所述HCM诊断模型,并且输出指示用户是否患有HCM的诊断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;中国医学科学院阜外医院,未经清华大学;中国医学科学院阜外医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210226696.4/1.html,转载请声明来源钻瓜专利网。