[发明专利]一种基于特征权重的LARS糖尿病预测方法有效
申请号: | 202010205152.0 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111223569B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 陈波;高秀娥;陈世峰;桑海涛;谢文学 | 申请(专利权)人: | 岭南师范学院 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G06F17/18;G06F17/16 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 何志欣 |
地址: | 524048 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 权重 lars 糖尿病 预测 方法 | ||
本发明涉及一种基于特征权重的LARS糖尿病预测系统,该系统包括存储设备;基于特征权重的LARS糖尿病预测模块,其耦合到存储设备且被配置为:计算自变量特征权重向量和原始相关度向量;基于所述自变量特征权重向量和所述原始相关度向量,输出基于特征权重的LARS糖尿病模型的回归系数ω。从糖尿病数据集特征出发,筛选出糖尿病关键特征变量,简化了糖尿病预测模型;提高了糖尿病预测模型的准确性,从而有助于提供准确的糖尿病预防与治疗措施。
技术领域
本发明涉及医疗信息化技术领域,尤其涉及一种基于特征权重的LARS糖尿病预测方法。
背景技术
糖尿病作为一种与生活方式和环境因素密切相关的慢性非传染性疾病,影响人群范围广,并发症致残、致死率高,需要庞大的社会资源及医疗资源支出。如何更准确地预测、预防、减少糖尿病的发病,以及制定更有效的治疗方案以减少并发症的发生发展,成为目前面临的难题。糖尿病的不良预后往往与长期高血糖暴露相关,然而在患者血糖升高的初期往往临床症状不明显。如果能在血糖升高之前就对糖尿病发病进行精准的预测,则对于糖尿病的防治具有重大的意义。
糖尿病个体发病预测模型能有效识别糖尿病高危人群、是选择干预方案的必要工具,可为健康管理、疾病预防决策以及干预方案效果评价提供依据,已经被广泛认可。糖尿病个体发病预测模型似乎使我们对于高危人群的发病有了一定的前瞻预测性,但更为重要的是,糖尿病的发病虽然有遗传因素的作用,其与生活方式以及环境因素密切相关。而目前所提出的大量预测模型,均只考虑了单一的因素,未能将各种因素整合,也尚未将环境与这些因素的相互作用考虑计算在内,并且往往是只在单一种族中验证。
因此糖尿病个体发病预测模型的建立,必将伴随着特征越来越多、维数越来越大的庞大数据,带来了较多的非关键信息和冗余信息,预测模型也变得越来越复杂。传统糖尿病个体发病预测模型难于直接应用于糖尿病的预测中。针对该问题,目前最有效的处理手段之一就是数学建模,而建模之初,通常会尽可能多地选择自变量来减少因缺少自变量而出现的模型偏差,但在实际建模过程中需要寻找对因变量最具有解释性的自变量子集,这个过程称为特征选择,是建模过程中很重要的一个问题。常见的特征选择算法有如基于Lasso(Least Absolute Shrinkage and Selection Operator,又译最小绝对值收敛和选择算子、套索算法、线性回归的L1正则化)的降维算法,其目的是抽取与分类任务相关度最高的特征,同时去除相关度低的特征来减少计算开销。
Lasso算法是一种最小二乘法,用于建立低维的线性模型,来预测响应输出变量。该算法通过在损失函数中引入L1惩罚函数,在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而使一些指标的回归系数严格等于零,也就是说,Lasso算法具有变量稀疏的特性,能够消除冗余特征,发现问题需要且仅需要的变量,实现指标集合精简的同时得到对结果具有较强解释能力的模型。LASSO是一种最小二乘法,用于建立低维的线性模型,来预测响应输出变量。
LARS算法用于决定哪些变量被选入模型并给出相应变量的参数估计。该算法不是在每一步前向逐步回归中直接加入某个变量,而是先找出和因变量相关度最高的那个变量,然后沿着最小平方误差的方向对变量的系数进行调整,在调整过程中,该变量和残差项的相关系数会逐渐减小直到出现新的变量与残差的相关性大于此时该变量与残差的相关性,然后重新沿着最小平方误差的方向进行调整,重复进行该过程,直至所有变量被选入自变量集合中,最终得到所求的参数估计。
但是Lasso回归的损失函数不是连续可导的,由于L1范数用的是绝对值之和,导致损失函数有不可导的点,不能直接得到解析解,所以需要通过迭代算法来进行求解。对此,通常采用最小角回归(Least Angle Regressi on,LARS)算法来求有这个L1范数的损失函数极小值。LARS算法是一个适用于高维数据的回归算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岭南师范学院,未经岭南师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010205152.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用于自动泡茶终端的冲茶装置和换茶装置
- 下一篇:一种糠醛制备糠酸的方法