[发明专利]一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法有效
申请号: | 201910114333.X | 申请日: | 2019-02-14 |
公开(公告)号: | CN109859801B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 于韬;李强;赵丹;王哲;王浩天;朱家伟 | 申请(专利权)人: | 辽宁省肿瘤医院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B25/10;G16B50/00 |
代理公司: | 沈阳亚泰专利商标代理有限公司 21107 | 代理人: | 史力伏 |
地址: | 110042 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 含有 七个 基因 作为 生物 标志 预测 肺鳞癌 预后 模型 建立 方法 | ||
1.含有七个基因作为生物标志物在预测肺鳞癌预后模型中的应用,其特征在于,所述7个基因为CSRNP1、CLEC18B、MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42,其中CSRNP1和CLEC18B的表达与存活率呈正相关,而MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42的表达与存活率呈负相关。
2.如权利要求1所述的应用,其特征在于,所述肺鳞癌预后模型的建立方法,具体包括以下步骤:
1)数据采集
从癌症基因组图谱数据库总共获得551个样品,包括49个正常样品和502个肺鳞状癌样品,所有样品包含年龄、性别、种族、吸烟状况、癌症阶段、存活时间和RNA表达谱的相应临床数据,通过符合选择标准的R筛选出差异表达的基因如下:p 0.05;| log2fold更改| 1;
2)Cox回归模型的构建
通过收集不同表达的基因,随机选择363个样本作为训练集,188个样本作为基于R的测验集,使用Cox单变量分析来获得预后相关基因;通过逐步回归进行Cox多变量分析,以最终确定具有可预测变量的模型;风险评分分期模型是通过R包“生存”函数coxph()开发的,公式如下:,其中i表示可预测基因的数量,β表示基因系数,X表示相应基因的相对表达值,系数β0的基因与存活时间呈负相关,是危险因素,系数β0的基因被定义为保护基因;样本按风险评分进行分类,高风险组的风险评分超过风险评分的中位数,低风险组的风险评分较低,并且通过Kaplan-Meier曲线进行高风险组和低风险组之间的存活率比较,并通过R包“生存”通过对数秩检验进行分析,进行关于随访时间和风险评分之间关系的关系图,通过R包“pROC”进一步使用接受者操作特征分析来评估该模型是否是预测预后的最佳模型;
3)在测验集和所有样本上验证模型
根据测验集和所有样本中先前的风险评分,将样本分为高风险组和低风险组,使用Kaplan-Meier曲线和对数秩检验来比较两组之间存活率的差异;
4)风险评分与其他因素的关系分析
首先确定风险评分与预后显著相关,然后比较不同分数的临床信息之间的差异,此外Cox回归模型用于调查风险评分与其他临床信息之间的关系,包括年龄、性别、种族、吸烟状况和癌症阶段,利用树图来找出存活率与临床因素之间的关系以及风险评分,同时进行相关图以直接找到关联;
5)基因集富集分析
通过GSEA评估了高风险组和低风险组之间显著改变的信号通路,基因集富集分析通过Java软件GSEA进行;
6)统计分析
使用R软件包进行统计分析,所有分析均在R版本3.3.2中进行,使用以下软件包:“glmnet”、“lpc”、“CoxBoost”、“limma”和“ROCR”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁省肿瘤医院,未经辽宁省肿瘤医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910114333.X/1.html,转载请声明来源钻瓜专利网。