[发明专利]一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质在审
申请号: | 202011634864.0 | 申请日: | 2020-12-31 |
公开(公告)号: | CN113160994A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张文杰;王锦程;孙倍成;徐庆祥;李国强;刘巧玉;金康鹏;王飞;张海天 | 申请(专利权)人: | 南京鼓楼医院;南京医科大学 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16H50/20;G06T7/00;G06T7/45 |
代理公司: | 哈尔滨三目知识产权代理事务所(普通合伙) 23214 | 代理人: | 刘冰 |
地址: | 210005 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 无创筛查非 酒精性 脂肪 性肝炎 模型 构建 方法 预测 系统 设备 存储 介质 | ||
1.一种无创筛查非酒精性脂肪性肝炎模型的构建方法,其特征是:所述的检测方法通过以下步骤实现:
步骤一、采集脂肪性肝炎病人的血清、影像和病理数据;
收集数据,包括病人的基本信息、NASH和非NASH病理活检数据、肝脏B超图像和血清实验室检查数据;以及对应病人的肝脏BMP格式的超声图像;
其中,
NASH的中文含义为非酒精性脂肪性肝炎;
基本信息包括年龄、性别、身高、体重、BMI计算、饮酒史、是否合并糖尿病、肝炎病史;BMI的含义是身体质量指数,简称体质指数又称体重,英文为Body Mass Index,简称BMI;
血清实验室检查数据包括白细胞计数、血小板计数、谷丙转氨酶、谷草转氨酶、谷氨酰转肽酶、总胆红素、直接胆红素、凝血时间、碱性磷酸酶、白蛋白、血胆固醇、凝血国际标准化比值、血储铁蛋白、空腹血糖、尿酸、血脂、空腹胰岛素、HOMA指数;
步骤二、血清特征数据预处理;
除去NASH和非NASH病理活检数据,将其余血清变量统一进行如下标准化处理,处理方法为:
(1)将每个数值型变量从小到大排列,将小于第2.5%或者大于第97.5%的视为异常值并分别更改为2.5%和97.5%;
(2)将所有数值型变量归一化,公式为:Xn normalized=(Xn–Xmin)/(Xmax–Xmin);其中,Xn表示任一数值型变量,Xn normalized表示数值型变量Xn的归一化后的值,Xmax表示数值型变量中的最大值,Xmin表示数值型变量中的最小值;
步骤三、血清特征统计筛选;
选取采集的数据中的一部分作为训练组;之后,在训练组里通过斯皮尔曼相关性分析筛选出有显著相关性的指标;之后,通过前向条件多元logistic回归进行统计筛选得出与NASH有关联的血清指标;其中,所述的血清指标为谷草转氨酶、血小板计数、血脂、BMI计算、尿酸;
步骤四、B超特征提取和筛选;
所述的B超特征提取的是指计算提取肝脏组织灰度纹理特征;其中,灰度纹理特征包括灰度共生矩阵、灰度行走游程矩阵、强度直方图和不变矩四方面;
所述的筛选操作包括以下三步:
(1)组内和组间观察者一致性检验超过0.8;
(2)将由(1)步得到的筛选结果进行如下筛选:利用方差阈值法进行初筛操作,涉及的阈值设为1.0;
(3)将由(2)步得到的筛选结果进行如下筛选:采用lasso回归法进行最终筛选;具体为:
首先,采用Lasso回归模型,筛选出有效B超特征,所述的Lasso回归模型的代价函数为:
其中,xij代表了第i个病人数据的第j个B超特征变量,yi是第i个病人数据的响应变量,q表示B超特征变量的总数,m是病人数据的总数,λ为惩罚函数,为最优结果;
然后,将lasso回归法筛选出的非0系数变量作为最终建模的有效B超特征;
步骤五、使用支持向量机SVM整合有效B超特征;
利用支持向量机SVM模型对有效B超影像组特征进行预测,得到预测值R-NASH;其中,所述的SVM模型进行预测的步骤包括以下几步:
(1)选取高斯核函数:空间中x,z为空间任意两点,σ为函数的宽度参数;
(2)构造支持向量机模型:其中αi和b是待求的系数;αi是通过求解如下对偶问题而得到:
0≤αi,i=1,2,K,N
yi表示对于输入xi对应的R-NASH值yi;
i代表第i个、j代表第j个、aj、ai对于第j,i个样本的待求参数;xi、xj代表第i,j个样本B超输入特征;yj、yi代表第j、i个样本对应的整合B超特征R-NASH,N代表样本数量;求得最优解:选择α*的一个分量满足条件得到最优:
(3)利用得到的SVM模型,对B超影像组特征进行预测,得到预测值R-NASH:
其中,x为有效B超影像组特征构成的向量;
步骤六、获取的血清指标特征和B超的R-NASH特征进行组合,采用多元logistic回归方法,得到非酒精性脂肪性肝炎诊断模型,包括以下步骤:
(1)假定x1,x2,K,xn为预测值R-NASH和其他血清指标特征,g为纤维化指标,回归模型如下:
z=hθ(x)=θ0+θ1x1+θ2x2+Λ+θnxn
其中,θ0,θ1,θ2Λθn是多元logistic回归的模型参数,n为变量的个数,采用的特征包括了:R-NASH、PLT、AST、BMI、Lipid、Uric acid;
(2)求得模型参数,得到诊断模型为:
YNASH=2.145×R-NASH–0.306×PLT+0.267×AST+1.152×BMI+1.185×Lipid+0.114×Uric acid–3.375;
步骤七、模型确认;
通过模型对比和效能分析,根据ROC曲线的最大约登指数来确认评价NASH的模型阈值范围,从而获得最终参数固定的模型,用于预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京鼓楼医院;南京医科大学,未经南京鼓楼医院;南京医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011634864.0/1.html,转载请声明来源钻瓜专利网。