[发明专利]基于机器学习的低密度脂蛋白建模方法、装置及存储介质在审
申请号: | 202210820064.0 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115376683A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 樊高威;王清涛 | 申请(专利权)人: | 首都医科大学附属北京朝阳医院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16B15/20;G16B40/20 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 秦莹 |
地址: | 100020*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 密度 脂蛋白 建模 方法 装置 存储 介质 | ||
1.一种基于机器学习的低密度脂蛋白建模方法,其特征在于,包括:
将获取的生物指标作为样本随机分为大小相等的数据集,将所述数据集分为训练集和测试集,其中,所述训练集和测试集进行交叉验证;
确定输入变量参数,其中,所述输入变量参数具体包括:年龄、性别、总胆固醇、高密度脂蛋白胆固醇、甘油三酯、总胆固醇、高密度脂蛋白胆固醇的差值、总胆固醇和甘油三酯的差值、甘油三酯和高密度脂蛋白胆固醇差值、高密度脂蛋白胆固醇/甘油三酯比值以及总胆固醇/高密度脂蛋白胆固醇的比值;
利用训练集,采用机器学习的方法,基于多种特征选择算法,将所述输入变量参数的组合作为输入对低密度脂蛋白计算模型进行训练,得到训练好的低密度脂蛋白计算模型;
利用测试集对所述训练好的低密度脂蛋白计算模型进行验证,在验证通过后,得到最终的低密度脂蛋白计算模型。
2.根据权利要求1所述的方法,其特征在于,
将获取的生物指标作为样本随机分为大小相等的数据集,将所述数据集分为训练集和测试集具体包括:
将获取的生物指标作为样本随机分为5个大小相等的数据集,4个作为训练集和1个作为测试集,其中,所述训练集和测试集用于进行5倍交叉验证,所述5倍交叉验证即每次使用其中的1个数据集作为测试集,剩下4个数据集作为训练集,进行模型训练和测试,如此重复5次训练测试,每次轮流使用其中的一个数据集作为测试集;
所述方法进一步包括:
使用最终的低密度脂蛋白计算模型进行低密度脂蛋白的计算。
3.根据权利要求1所述的方法,其特征在于,所述最终的低密度脂蛋白计算模型的特征选择算法为:
将年龄、性别、总胆固醇、高密度脂蛋白胆固醇、甘油三酯、总胆固醇和高密度脂蛋白胆固醇的差值、总胆固醇和甘油三酯的差值、甘油三酯和高密度脂蛋白胆固醇差值、高密度脂蛋白胆固醇与甘油三酯的比值以及总胆固醇与高密度脂蛋白胆固醇的比值作为第一输入变量参数时,采用Bagging M5Rules算法。
4.根据权利要求1所述的方法,其特征在于,所述最终的低密度脂蛋白计算模型的特征选择算法为:
将年龄、性别、总胆固醇、高密度脂蛋白胆固醇、甘油三酯、总胆固醇和高密度脂蛋白胆固醇的差值、总胆固醇和甘油三酯的差值、甘油三酯和高密度脂蛋白胆固醇差值、高密度脂蛋白胆固醇与甘油三酯的比值以及总胆固醇与高密度脂蛋白胆固醇的比值作为所述第一输入变量参数时,采用Bagging RandomForest算法。
5.一种基于机器学习的低密度脂蛋白建模装置,其特征在于,包括:
处理模块,用于将获取的生物指标作为样本随机分为大小相等的数据集,将所述数据集分为训练集和测试集,其中,所述训练集和测试集用于进行交叉验证;
确定模块,用于确定输入变量参数,其中,所述输入变量参数具体包括:年龄、性别、总胆固醇、高密度脂蛋白胆固醇、甘油三酯、总胆固醇和高密度脂蛋白胆固醇的差值、总胆固醇和甘油三酯的差值、甘油三酯和高密度脂蛋白胆固醇差值、高密度脂蛋白胆固醇/甘油三酯比值、以及总胆固醇/高密度脂蛋白胆固醇的比值;
训练模块,用于利用训练集,采用机器学习的方法,基于多种特征选择算法,将所述输入变量参数的组合作为输入对低密度脂蛋白计算模型进行训练,得到训练好的低密度脂蛋白计算模型;
验证模块,用于利用测试集对所述训练好的低密度脂蛋白计算模型进行验证,在验证通过后,得到最终的低密度脂蛋白计算模型。
6.根据权利要求5所述的装置,其特征在于,
所述处理模块具体用于:将获取的生物指标作为样本随机分为5个大小相等的数据集,4个作为训练集和1个作为测试集,其中,所述训练集和测试集用于进行5倍交叉验证,所述5倍交叉验证即每次使用其中的1个数据集作为测试集,剩下4个数据集作为训练集,进行模型训练和测试,如此重复5次训练测试,每次轮流使用其中的一个数据集作为测试集;
所述装置进一步包括:
计算模块,用于使用最终的低密度脂蛋白计算模型进行低密度脂蛋白的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京朝阳医院,未经首都医科大学附属北京朝阳医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210820064.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法以及装置
- 下一篇:一种超长棒状聚3-己基噻吩晶体的制备方法