[发明专利]以87个基因作为生物标志物预测细胞增殖活性的模型在审
申请号: | 202010554703.4 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111739586A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 吴超;郑敏 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16B40/30 | 分类号: | G16B40/30;G16B50/00;G16B5/00;G16B25/10 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 赵杭丽 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 87 基因 作为 生物 标志 预测 细胞 增殖 活性 模型 | ||
1.一种以87个基因作为生物标志物预测细胞增殖活性的模型,其特征在于,通过以下步骤实现:
(1)建立细胞增殖基因集合:
1)数据采集
从Tabula Muris数据库获得不同类型正常细胞的单细胞RNA-Seq数据,从癌症基因组图谱数据库获得癌症和癌旁组织RNA-Seq数据,从GTEx数据库中获得组织RNA-Seq数据,从CCLE数据库获得细胞系RNA-Seq数据与细胞增殖活性数据;
2)干/组细胞特异性表达基因集合挖掘
a)将Tabula Muris数据库中的体内正常单细胞按细胞类型归为81类,计算各类细胞的基因表达值,对某一特定细胞类型i当中的某一基因j,计算其表达值(Xji)如下:
其中m为属于细胞类型i的细胞总数,n为细胞类型i中细胞基因j的reads count大于0的细胞的数目,计算细胞类型i中所有基因的表达值,依次计算81种细胞类型的所有基因的表达值;
b)将81类细胞分为两组:干/组细胞组与其他细胞组;
c)使用层次聚类分析,挖掘在干/组细胞组中高表达,在其他细胞组极低表达的基因,作为干/组细胞特异性基因集合;
3)细胞增殖基因集合挖掘
a)获得GTEx数据库中各正常组织样本中干/组细胞特异性基因集合中基因的表达值,在绝大多数正常组织中不具有增殖活性的终末细胞占据主要成分,为此对基因进行层次聚类分析,获得在正常组织中低表达的87个基因组成的基因群;
b)获得TCGA数据库癌和癌旁组织样本中上述87个基因的表达值,对某一个基因j,计算其在所有癌和癌旁组织样本中Z-score标准化的基因表达值Yj,对某一个样本k,列举其87个基因的表达向量为{Y1k,Y2k,…,Y87k},然后,计算基因集合的表达值为87个基因表达向量的中值,进一步使用T检验将每一种癌症的样本的基因集合表达值与所有癌旁样本的基因集合表达值进行比较,由于绝大多数癌组织由高增殖的癌细胞组成,进一步确认上述基因集合在癌组织高表达,在癌旁低表达,确认上述87个基因组成的基因群为细胞增殖基因集合;
(2)使用上述细胞增殖基因集合建立预测细胞增殖活性的模型:
1)细胞增殖基因集合预测体外培养癌细胞系增殖活性
a)获得CCLE数据库中各癌症细胞系中细胞增殖基因集合中基因的表达值,对某一个基因j,计算其在所有细胞系样本中Z-score标准化的基因表达值Zj,对某一个细胞系样本k,列举其87个基因的表达向量为{Z1k,Z2k,…,Z87k},然后,计算基因集合的表达值为上述87个基因表达值的中值,计算每一个细胞系样本的细胞增殖基因集合表达值;
b)获得CCLE数据库中部分细胞增殖活性数据;
c)对细胞系样本的细胞增殖基因集合表达值数据与对应细胞系的倍增时间数据,进行皮尔森相关分析,确认在来源于实体瘤的癌症细胞系中,细胞增殖活性与87个基因组成的细胞增殖基因集合表达值存在显著正相关,通过细胞增殖基因集合表达高低预测来源于实体瘤的癌症细胞系的增殖活性;
2)建立细胞增殖活性预测模型
a)将Tabula Muris数据库中的单细胞按细胞类型归为81类,获得各类细胞的基因表达值如上;
b)使用上述87个基因的表达值对81个细胞类型进行层次聚类分析,通过聚类分析,将细胞类型聚成2-3类;
c)对81个细胞类型中的每一个细胞类型,计算其细胞增殖基因集合表达值,获取每一个细胞类型中细胞增殖基因集合中87个基因的表达值,对某一个细胞类型i,对某一个基因j的基因表达值Xji,列举其87个基因的表达向量为{X1i,X2i,…,X87i},然后计算细胞增殖基因集合的表达值为上述87个基因表达值的中值;
d)依据聚类分析的结果,将81个细胞类型聚成2-3个不同的细胞类型群,对每一个细胞类型群,获得其细胞增殖基因集合的表达值向量,比较不同细胞类型群的细胞增殖基因集合的表达值,以P0.05为阈值,判断是否某一细胞类型群的细胞增殖基因集合表达值显著高于其他细胞类型群,从而确认高表达细胞增殖基因的细胞类型与低表达细胞增殖基因的细胞类型,实现对81种细胞类型增殖活性的评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010554703.4/1.html,转载请声明来源钻瓜专利网。