[发明专利]一种风险预估模型的构建方法及装置在审
申请号: | 201710112713.0 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106897566A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 吕艳伟;田伟;段芳芳;王立芳 | 申请(专利权)人: | 北京积水潭医院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京太合九思知识产权代理有限公司11610 | 代理人: | 刘戈 |
地址: | 100035 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风险 预估 模型 构建 方法 装置 | ||
技术领域
本发明实施例涉及风险评估领域,尤其涉及一种风险预估模型的构建方法及装置。
背景技术
颈椎病又称颈椎综合征,是颈椎骨关节炎、增生性颈椎炎、颈神经根综合征、颈椎间盘脱出症的总称,是一种以退行性病理改变为基础的疾患。主要由于颈椎长期劳损、骨质增生,或椎间盘脱出、韧带增厚,致使颈椎脊髓、神经根或椎动脉受压,出现一系列功能障碍的临床综合征。
据资料显示,近年来,随着手机、电脑等电子设备的普及,越来越多的人每天长时间伏案工作或低头刷屏,这导致颈椎病发病率逐年升高,发病人群也越来越年轻化。
当前,如何提前预估颈椎病的发病风险,以便及时采取措施防止颈椎病的发生,已成为当下亟需解决的一大问题。
发明内容
本发明实施例提供一种风险预估模型的构建方法及装置,用以解决现有技术中无法提前预估颈椎病的发病风险的问题。
本发明实施例提供一种风险预估模型的构建方法,包括:
从多个候选危险因素中,选择至少一个目标危险因素;
从多个数据样本中,选择第一数据样本集和第二数据样本集;所述多个数据样本中的每个数据样本包括所述至少一个目标危险因素对应的因素值以及风险结果;
根据所述第一数据样本集中的数据样本进行模型训练,得到多个初始风险预估模型;
根据所述第二数据样本集中的数据样本,分别对所述多个初始风险预估模型进行性能评价;
选择所述多个初始风险预估模型中性能评价符合要求的风险预估模型。
在一可选实施例中,所述从多个候选危险因素中,选择至少一个目标危险因素,包括:
基于所述风险结果,对所述多个候选危险因素进行单因素分析,以获取所述多个候选危险因素中可能度P<第一阈值的危险因素;
对所述P<第一阈值的危险因素进行多因素回归分析,以获得所述P<第一阈值的危险因素中的检验水平为设定值的至少一个危险因素,作为所述至少一个目标危险因素。
在一可选实施例中,所述根据所述第一数据样本集中的数据样本进行模型训练,包括:
采用SVM中的不同核函数,分别对所述第一数据样本集中的数据样本进行模型训练,以获得多个SVM预估模型;
所述不同核函数包含高斯核函数、线性核函数、多项式核函数以及Sigmoid核函数中的至少两个。
在一可选实施例中,所述分别对所述多个初始风险预估模型进行性能评价,包括:
将所述第二数据样本集中的数据样本作为输入,分别运行所述不同核函数对应的SVM预估模型,以获得所述不同核函数对应的SVM预估模型的输出结果;
根据所述不同核函数对应的SVM预估模型的输出结果,分析所述不同核函数对应的SVM预估模型的性能指标;
所述选择所述多个初始风险预估模型中性能评价符合要求的风险预估模型,包括:
将所述第二数据样本集中的数据样本作为输入,运行Logistic预估模型,以获得所述Logistic预估模型的输出结果;
根据所述Logistic预估模型的输出结果,分析所述Logistic预估模型的性能指标;
将所述不同核函数对应的SVM预估模型的性能指标,分别与所述Logistic预估模型的性能指标做比较;
选择所述不同核函数对应的SVM预估模型中比较结果符合要求的SVM预估模型。
在一可选实施例中,所述将所述第二数据样本集中的数据样本作为输入,分别运行所述不同核函数对应的SVM预估模型,以获得所述不同核函数对应的SVM预估模型的输出结果,包括:
将所述第二数据样本集中的数据样本作为输入,分别运行所述不同核函数对应的SVM预估模型,以获得所述不同核函数对应的SVM预估模型的ROC曲线;
所述根据所述不同核函数对应的SVM预估模型的输出结果,分析所述不同核函数对应的SVM预估模型的性能指标,包括:
根据约登指数最大化的标准,选择所述不同核函数对应的SVM预估模型的ROC曲线的切点值;
根据所述切点值,计算所述不同核函数对应的SVM预估模型的性能指标。
在一可选实施例中,所述性能指标包括以下至少一种:
ROC曲线下的面积、灵敏度、特异度、约登指数、阳性预测值、阴性预测值、预测准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京积水潭医院,未经北京积水潭医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710112713.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用