[发明专利]一种尿结石风险评估模型的构建方法及构建体系在审
申请号: | 202211671341.2 | 申请日: | 2022-12-23 |
公开(公告)号: | CN115862846A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 罗宏敏;吴莉萍;姜盼盼;郑晨晴;鲁艳;杨琴;杨旭;杨江涛 | 申请(专利权)人: | 深圳爱湾医学检验实验室 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F18/241;G06F18/214 |
代理公司: | 合肥上博知识产权代理事务所(特殊普通合伙) 34188 | 代理人: | 周超 |
地址: | 518000 广东省深圳市光明区凤凰街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结石 风险 评估 模型 构建 方法 体系 | ||
1.一种尿结石风险评估模型的构建方法,其特征在于,包括以下步骤:
S1,数据集划分:
从原始样本数据集中选择可用于模型评估的有效样本按一定比例随机划分为训练集和验证集,从新样本集中选择可用于模型验证的有效样本作为测试集;
S2,数据预处理:
对待估指标进行标准化和过滤处理,获得有效样本;
S3,特征指标筛选:
从模型评估的有效样本按一定条件筛选出符合医疗辅助应用的特征指标;
S4,模型构建:
建立偏最小二乘判别分析的方法拟合训练集并在验证集中进行预测;
S5,模型验证:
根据ROC曲线使用测试集计算模型分类阈值p,从而构建出尿结石风险评估模型。
2.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述S2中有效样本的获取步骤如下:
S2.1,根据尿结石标准将样本数据分为尿结石患者组和健康对照组,对不能明确结果的样本进行删除;
S2.2,对传统风险因素数据和有机酸风险因素数据进行肌酐校正处理;
S2.3,对样本数据中0值超过60%的指标进行删除处理;
S2.4,对缺失数据进行删除处理;
S2.5,对数值型指标进行Z-Score标准化处理,从而获得可用于构建风险评估的有效样本。
3.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述特征指标是由训练集有效样本所构建的模型得到相关参数值,再根据一定筛选条件对相关参数进行筛选得到,具体步骤如下:
S3.1,利用训练集和验证集的有效样本数据,分别进行传统风险因素和有机酸风险因素特征指标筛选,建立两个初始偏最小二乘判别分析模型,即对样本的分类变量矩阵Yn×2和待估指标矩阵Xn×m进行分解,其中,n为样本个数,m为待估指标个数;
S3.2,计算两个初始偏最小二乘判别分析模型中各指标的变量投影重要性分析值(VIP);
S3.3,依据步骤S3.2所得结果,分别取传统风险因素和有机酸风险因素中变量投影重要性分析值大于1的指标,并将筛选出的特征指标进行倒序排列;
S3.4,将步骤S3.3中选取的指标合并作为特征指标。
4.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述训练集和验证集划分比例为7:3。
5.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述模型构建的具体步骤如下:
S4.1,按照7:3的比例,将原始数据集划分为训练集train和验证集validation,新样本数据集作为测试集test;
S4.2,使用偏最小二乘判别分析的方法拟合train数据集进行模型构建,获得模型参数,所构建模型如下所示:
其中,T为特征指标矩阵,β为特征指标的权重矩阵,n为特征指标个数;
S4.3,根据所构建模型对验证集进行预测得到初始ROC曲线。
6.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述S5构建出尿结石风险评估模型;具体步骤如下:
S5.1,在测试集中,根据所构建的偏最小二乘判别分析模型进行预测,得到分类预测得分;
S5.2,选择在[0,1]范围内的不同预测得分数值作为分类阈值;
S5.3,分别计算各分类阈值的预测灵敏度、特异度、真阴性率和假阴性率,并绘制ROC曲线图;
S5.4,根据ROC曲线图在满足AUC大于90%的情况下选取灵敏度和特异度大于80%的分类阈值。
7.根据权利要求6所述的一种尿结石风险评估模型的构建方法,其特征在于,根据ROC曲线使用测试集计算模型分类阈值p,模型拟合值高于阈值p预测为尿结石阳性者,低于阈值p预测为尿结石阴性者。
8.一种运行权利要求1-7任一项所述方法的构建体系,其特征在于,包括数据收集模块、数据预处理模块、模型构建模块、模型检验模块和阈值确定模块;
所述数据收集模块,用于数据收集,获取样本数据集;
所述数据预处理模块,用于从原始样本数据集中提取可用于模型评估的有效样本,以及从新样本数据集中提取可用于模型检验的有效数据;
所述模型构建模块,用于将所述模型评估有效样本划分为训练集和验证集,使用偏最小二乘判别分析的方法拟合训练集并在验证集中预测;
所述模型检验模块,可用于将模型验证有效样本作为测试集,进一步检验模型;
所述阈值确定模块,可用于依据测试集的ROC曲线计算模型分类阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳爱湾医学检验实验室,未经深圳爱湾医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211671341.2/1.html,转载请声明来源钻瓜专利网。