[发明专利]一种应用贝伐珠单抗干预的机体卵巢癌细胞增殖或凋亡的预测方法在审
申请号: | 202310149625.3 | 申请日: | 2023-02-16 |
公开(公告)号: | CN116313048A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 黄晓雨;李平;曾心妍 | 申请(专利权)人: | 安徽医科大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30;G06F18/241;G06F18/213 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 孙永刚;张祥骞 |
地址: | 230032 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 贝伐珠单抗 干预 机体 卵巢 癌细胞 增殖 预测 方法 | ||
1.一种应用贝伐珠单抗干预的机体卵巢癌细胞增殖或凋亡的预测方法,其特征在于,包括以下步骤:
11)机体卵巢癌细胞基础数据的获取与预处理:获取机体卵巢癌细胞的基础数据,包括应用贝伐珠单抗干预的基础数据,提取和标记卵巢癌细胞应用贝伐珠单抗干预前后的基础数据以及卵巢癌细胞增殖/凋亡与否制作为标签,对基础数据进行数据编码、数据清洗、规范化预处理操作得到处理后的数据,划分数据集用于后续卵巢癌细胞应用贝伐珠单抗干预后的增殖/凋亡预测模型以及增殖/凋亡相关显著特征提取和预测模型的训练与测试;
12)增殖/凋亡预测模型的构建:构建全特征分类模型,根据Relief特征选择算法获得卵巢癌细胞增殖/凋亡的备选显著特征集,基于备选显著特征集提取卵巢癌增殖/凋亡的显著特征集,再基于提取的显著特征建立增殖/凋亡预测模型;
13)应用贝伐珠单抗干预的机体卵巢癌细胞增殖/凋亡的预测:构建关于卵巢癌细胞干预后的增殖/凋亡时长的全特征回归模型,模型泛化能力指标用测试集的决定系数R2衡量,基于全特征回归预测模型得到卵巢癌细胞干预后的增殖/凋亡时长备选显著特征集,再基于备选显著特征集提取卵巢癌细胞干预后的增殖/凋亡时长显著特征集,最后基于提取的显著特征建立卵巢癌细胞干预后的增殖/凋亡时长数据的预测模型,实现应用贝伐珠单抗干预的机体卵巢癌细胞增殖或凋亡的预测。
2.根据权利要求1所述的一种应用贝伐珠单抗干预的机体卵巢癌细胞增殖或凋亡的预测方法,其特征在于,所述的机体卵巢癌细胞基础数据的获取与预处理包括以下步骤:
21)机体卵巢癌细胞数据获取:收集记录不同机体的卵巢癌细胞信息数据,包括三类信息数据;第一类数据,开始应用贝伐珠单抗干预时卵巢癌肿瘤微环境中总蛋白、白蛋白、球蛋白、白/球蛋白比值、碱性磷酸酶、乳酸脱氢酶、肌酐、尿素、钾、钠、氯、碳酸氢根、钙、磷、葡萄糖、总胆固醇、甘油三酯、高密度脂蛋白胆固醇、非高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、极低密度脂蛋白胆固醇、载脂蛋白A1、载脂蛋白B、脂蛋白a、游离脂肪酸的检测指标数据;第二类数据,肿瘤增殖/凋亡时卵巢癌肿瘤微环境中总蛋白、白蛋白、球蛋白、白/球蛋白比值、碱性磷酸酶、乳酸脱氢酶、肌酐、尿素、钾、钠、氯、碳酸氢根、钙、磷、葡萄糖、总胆固醇、甘油三酯、高密度脂蛋白胆固醇、非高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、极低密度脂蛋白胆固醇、载脂蛋白A1、载脂蛋白B、脂蛋白a、游离脂肪酸检测指标数据;第三类数据,卵巢癌细胞群是否继续增殖或凋亡的分类变量数据;
22)应用贝伐珠单抗干预的机体卵巢癌细胞数据的预处理,应用贝伐珠单抗干预的机体卵巢癌细胞数据进行数据编码、数据清洗,数据规范化处理和数据集划分,具体步骤如下:
221)应用贝伐珠单抗干预的机体卵巢癌细胞数据的编码:将数据中的非数值数据编码成算法处理的数值数据,同一类数据编为一码,实现数据编码,操作对象包含是否增殖/凋亡分类变量;
222)应用贝伐珠单抗干预的机体卵巢癌细胞数据的清洗:
基于干预前卵巢癌细胞特征数据进行显著特征提取和预测时,删除干预后的特征变量数据;删除缺失值超过半数的特征数据;通过联合散点图、箱型图、变量分布图的可视化方法找出异常特征数据并删除;对于离散型数据,采用中值填充或者众数填充操作,对于连续型数据,采用均值填充;
223)应用贝伐珠单抗干预的机体卵巢癌细胞数据的规范化处理:将经上述处理过的数据进行归一化,实现数据规范化处理;
224)预测模型的数据集划分:按照8:2的比例将处理好的数据随机划分为训练集和测试集,测试集和训练集的卵巢癌细胞增殖/凋亡比例做到均衡合理,用于后续机体卵巢癌细胞应用贝伐珠单抗干预后的增殖/凋亡预测模型的训练与测试;
225)贝伐珠单抗干预后的增殖/凋亡时长的显著特征提取和预测模型的数据集划分:保证测试集和训练集的机体卵巢癌细胞应用贝伐珠单抗干预后的增殖/凋亡时间长短分布一致,用于后续构建的影响机体卵巢癌细胞应用贝伐珠单抗干预后增殖/凋亡时长的显著特征提取和预测模型的训练与测试,具体步骤如下:
2251)贝伐珠单抗干预后的增殖/凋亡时长的显著特征提取和预测模型的数据集按照8:2的比例随机划分为显著特征训练集和显著特征测试集;
2252)绘制显著特征训练集和显著特征测试集上卵巢癌干预后的细胞增殖/凋亡时长的数据分布曲线,并初步建立关于卵巢癌用药后的细胞增殖/凋亡时长全特征回归模型,选取多项式回归、决策树回归模型,不进行模型超参数调整,模型泛化能力指标用测试集的决定系数R2衡量,观测模型泛化能力和训练集与测试集上的时长数据分布曲线,决定系数R2的计算公式如下,
上式中,yi表示机体i卵巢癌细胞的增殖/凋亡时长真实数据,表示模型估计机体i卵巢癌细胞得到的增殖/凋亡时长估计值,表示机体卵巢癌细胞真实增殖/凋亡时长数据的平均值,n为样本总数,SSR、SSE、SST分别表示回归平方和、残差平方和、离差平方和;
2253)如果模型泛化能力大于0.70,且训练集和测试集上的数据分布曲线近似相似,则选取该数据集划分方案,否则,转到步骤2251)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽医科大学,未经安徽医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310149625.3/1.html,转载请声明来源钻瓜专利网。