[发明专利]一种基于基因交互网络聚类和群稀疏学习的表达数量性状与CNV关联的方法在审
申请号: | 202111317810.6 | 申请日: | 2021-11-09 |
公开(公告)号: | CN114038502A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 陈浩文;张翔;宁斌;屈强 | 申请(专利权)人: | 湖南大学 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B30/00;G16B40/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 基因 交互 网络 稀疏 学习 表达 数量 性状 cnv 关联 方法 | ||
本发明涉及生物信息学中的数据挖掘领域,具体涉及一种基于异构图卷积神经网络的合成致死相互作用预测方法。其发明内容主要包括:(1)收集乳腺癌FPKMRNA‑seq信息、乳腺癌的CNV数据、乳腺癌高置信度风险基因信息;(2)进行基于秩的方法对乳腺癌拷贝数变异(CNV)和mRNA数据进行预处理;(3)建立基于蛋白质相互作用知识和信号通路的基因‑基因相互作用网络,利用网络聚类算法生成高密度子网络;(4)构建基于群稀疏学习模型来描述子网与目标基因的mRNA表达之间的关联关系,使用均方根误差(RMSE)衡量CNVs预测目标基因表达变化的能力,采用k‑fold折交叉验证算法进行交叉验证,使用Speraman相关研究方法,并结合通路富集分析对基因表达与CNV进行相关性分析。
技术领域
本发明涉及生物信息学中的数据挖掘领域,具体涉及一种基于基因交互网络聚类和群稀疏学习的表达数量性状与CNV关联的方法。
背景技术
下一代测序(NGS)技术允许研究人员描绘特定肿瘤甚至泛癌方式的突变景观。在肿瘤的发展过程中,基因组中积累了不同类型的突变,包括单核苷酸多态性(singlenucleotide polymorphisms,SNPs)、染色体片段、拷贝数变异(copy number variations,CNVs)、基因融合等。
由于不同的肿瘤亚型可能采用不同的免疫逃避途径,导致不同的亚型具有不同的耐药性、病理和药物应答。致病基因和免疫基因的表达在不同的阶段或水平上受到调控,如表达数量性状位点(eQTL)、CNV、表观遗传修饰和调控qtl(regqtl)。例如,Ratnapriya(“Retinal transcriptome and eqtl analyses identify genes associated with age-related macular degeneration,”Nature genetics,vol.51,no.4,pp.606–610,2019.)等研究了900万个常见SNPs,分析了13662个蛋白编码基因和1462个非编码基因的eqtl,利用视网膜转录组数据检测新的年龄相关性黄斑变性(AMD)风险基因;Dobbyn(“Landscape ofconditional eqtl in dor-solateral prefrontal cortex and co-localization withschizophrenia gwas,”The American Journal of Human Genetics,vol.102,no.6,pp.1169–1184,2018.)等人研究了从467个人类大脑样本中收集的基因型和基因表达数据,发现条件型eQTL广泛存在。
现有研究基因表达调控机制的计算方法存在两个主要缺点:一是现有方法的统计模型相对简单,多为单变量关联分析方法,没有考虑多因素之间的相互作用。二是现有的研究方法对CNVs的作用研究不够深入、全面。
为了全面了解CNVs在基因表达中的作用,本发明提出了一种基于基因交互网络聚类和群稀疏学习的表达数量性状与CNV关联的方法,以此得到表达数量性状与CNV关联。
发明内容
本发明提出了一种基于基因交互网络聚类和群稀疏学习的表达数量性状与CNV关联的新方法,主要包括以下步骤:
(1)收集乳腺癌FPKM RNA-seq信息、乳腺癌的CNV数据、乳腺癌高置信度风险基因信息;
(2)进行基于秩的方法对乳腺癌拷贝数变异(CNV)和mRNA数据进行预处理;
(3)建立基于蛋白质相互作用知识和信号通路的基因-基因相互作用网络,利用网络聚类算法生成高密度子网络;
(4)构建基于群稀疏学习模型来描述子网与目标基因的mRNA表达之间的关联关系,使用均方根误差(RMSE)衡量CNVs预测目标基因表达变化的能力,采用k-fold折交叉验证算法进行交叉验证,使用Speraman相关研究方法,并结合通路富集分析对基因表达与CNV进行相关性分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111317810.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种燕麦拿铁咖啡及其制备方法
- 下一篇:一种防冻水表罩