[发明专利]基于转录组数据确定肿瘤标记物的方法有效

专利信息
申请号: 201510919456.2 申请日: 2015-12-11
公开(公告)号: CN106874705B 公开(公告)日: 2019-04-02
发明(设计)人: 李姣;郑思 申请(专利权)人: 中国医学科学院医学信息研究所
主分类号: G16B20/30 分类号: G16B20/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 李志东
地址: 100020*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于转录组数据确定肿瘤标记物的方法,包括:(1)获得转录组数据,包括第一和第二转录组数据,第一和第二转录组数据分别包括第一和第二个体样本的mRNA、lncRNA和miRNA表达数据,第一和第二个体样本的区别包括分别具有一对相对表型特征中的一个;(2)分别建立个体具有表型特征与三种RNA表达量关系的正则化逻辑回归模型,分别利用模型对三种RNA表达数据进行回归,获得三种RNA分子回归系数;(3)利用网格搜索,分别依据三种RNA分子回归系数确定三种RNA阈值;(4)分别将三种RNA分子回归系数与对应阈值比较,确定三种RNA候选标记;(5)混合三种RNA候选标记物获得RNA混合数据,以RNA混合数据替代转录组数据进行(2)‑(4),确定肿瘤标记物。
搜索关键词: 基于 转录 数据 确定 肿瘤 标记 方法
【主权项】:
1.一种基于转录组数据确定肿瘤标记物的方法,其特征在于,包括:(1)获得转录组数据,所述转录组数据包括多个个体样本的mRNA表达数据、lncRNA表达数据和miRNA表达数据,所述转录组数据包括第一转录组数据和第二转录组数据,所述第一转录组数据包括多个第一个体样本的mRNA表达数据、lncRNA表达数据和miRNA表达数据,所述第二转录组数据包括多个第二个体样本的mRNA表达数据、lncRNA表达数据和miRNA表达数据,所述第一个体样本和所述第二个体样本分别具有一对相对表型特征中的一个,所述表型特征与所述肿瘤相关;(2)分别建立个体存在所述表型特征与所述个体的mRNA、lncRNA和miRNA表达量的关系的正则化的逻辑回归模型,分别利用建立的正则化的逻辑回归模型对所述转录组数据中的mRNA表达数据、lncRNA表达数据和miRNA表达数据中的RNA分子进行回归分析,确定mRNA分子回归系数、lncRNA分子回归系数和miRNA分子回归系数,其中,建立逻辑回归模型,利用组套索算法正则化所述逻辑回归模型,包括确定调整参数λ,包括,确定所述调整参数的最大值λmax,对λ进行从0到λmax的网格化划分,任选的对λ进行从0到λmax的幂函数网格化划分,获得2+Num1个λi,其中i∈[0,Num1],任选的Num1为该种类型的RNA分子的个数,对于每个λi,基于所述转录组数据中的该种类型的RNA表达数据和所述逻辑回归模型,采用k倍交叉验证,确定其所对应的预测概率,其中包括,基于训练集确定所述逻辑回归模型的回归系数,利用确定了回归系数的逻辑回归模型预测验证集中个体样本存在所述表型特征的概率,获得k个所述预测概率,基于比较所述k个预测概率与其真实值的差异,利用ROC分析进行评估,确定最大AUC对应的λi为所述调整参数;(3)利用网格搜索,分别依据所述mRNA分子回归系数、lncRNA分子回归系数和miRNA分子回归系数确定mRNA阈值、lncRNA阈值和miRNA阈值,其中,步骤(3)是通过下列方式实现的:确定所述阈值cutoff的最大值cutoffmax,其中包括,分别以mRNA分子回归系数、lncRNA分子回归系数和miRNA分子回归系数中的绝对值最大的回归系数为该种类型RNA的阈值最大值cutoffmax,对cutoff进行从0到cutoffmax的网格化划分,任选的对cutoff进行从0到cutoffmax的幂函数网格化划分,获得2+Num2个cutoffj,其中j∈[0,Num2],任选的Num2为该种类型RNA分子的个数,对于每个cutoffj,采用留一法交叉验证,确定其所对应的预测概率,其中包括,选取该种类型RNA表达数据中回归系数绝对值大于cutoffj的RNA分子作为新模型的自变量,基于训练集确定所述新模型的回归系数,基于验证集、利用确定了回归系数的新模型预测个体样本存在所述表型特征的概率,获得2+Num2个所述预测概率,所述新模型为另一逻辑回归模型,基于比较所述2+Num2个预测概率与其真实值的差异,利用ROC分析进行评估,确定最大AUC对应的cutoffj为所述阈值;(4)分别将所述mRNA分子回归系数、lncRNA分子回归系数和miRNA分子回归系数与其对应的阈值比较,以确定mRNA候选标记物、lncRNA候选标记物和miRNA候选标记物;(5)混合所述mRNA候选标记物、lncRNA候选标记物和miRNA候选标记物,获得RNA混合数据,以所述RNA混合数据替代所述转录组数据进行步骤(2)‑(4),以确定所述肿瘤标记物。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院医学信息研究所,未经中国医学科学院医学信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510919456.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top