[发明专利]一种基于深度混合网络的单细胞转录组缺失值填补方法有效
申请号: | 201911072613.5 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110957009B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 何尧;谢志;袁皓 | 申请(专利权)人: | 中山大学中山眼科中心 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510060 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 混合 网络 单细胞 转录 缺失 填补 方法 | ||
本发明提供的一种基于深度混合网络的单细胞转录组缺失值填补方法,包括:对单细胞测序并进行预处理,得到表达矩阵并进行标准化处理;构建基于深度学习的混合模型,将标准化后的表达矩阵输入混合模型中进行循环计算,得到多个预测表达矩阵;计算每一次循环的权重,将多个预测表达矩阵按照对应的权重进行加权平均,得到的结果为混合模型的填补输出,完成对缺失值的填补。本发明提供的填补方法,借助深度神经网络对复杂函数的拟合能力适应单细胞的表达分布,保证了本填补方法对各类单细胞转录组数据的通用性;同时保留了深度学习在超大细胞数目的数据集上的可拓展性,完成了对单细胞转录组缺失值的填补,显著提高了单细胞数据解读的可靠性。
技术领域
本发明涉及单细胞转录组缺失填补技术领域,更具体的,涉及一种基于深度混合网络的单细胞转录组缺失值填补方法。
背景技术
单细胞转录组测序技术已发展成为一种研究单个细胞层面上基因表达的主要方法,被广泛应用于研究新的细胞类型、细胞分化、发育轨迹、肿瘤发生发展等重要的生物学问题。捕获的细胞数量,从最初的几个发展到现在的百万级别。但是,由于单个细胞的RNA含量极低、转录本捕获的低效率、技术上的噪音以及测序细胞数量多成本高等原因,单个细胞的低测序深度难以覆盖其所包含的转录本,导致细胞中大量基因表达值缺失(通常90%),致使生物信号模糊或丢失,造成后续分析困难。
填补(Imputation)单细胞转录组缺失值的难点在于在技术上无法区分表达值缺失与没有表达,因此缺少可靠的没有表达的样本。现有多个方法可以对单细胞转录组缺失值进行填补。其中,SAVER(Huang,M.,et al.“SAVER:Gene expression recovery forsingle-cell RNA sequencing(SAVER:恢复单细胞RNA测序中的基因表达)”NatureMethods 15,539-542,2018),scImpute(Li,W.,et al.“An accurate and robustimputation method scImpute for single-cell RNA-seq data (一个精确、鲁棒的对单细胞RNA测序数据进行填补的方法)”Nature Communications 9,997,2018),VIPER(Chen,M.,et al.“VIPER:variability-preserving imputation for accurate geneexpression recovery in single-cell RNA sequencing studies(单细胞RNA测序研究中保留变异性的填补可精确的修复基因表达)”Genome Biology 19,196,2018)均基于统计模型,预先假设基因表达分布并利用假设的分布来辨别缺失与没有表达,然后填补缺失的表达值;MAGIC(van Dijk,D.,et al.“Recovering Gene Interactions from Single-CellData Using Data Diffusion(利用数据扩散从单细胞数据中恢复基因相互作用)”Cell174,716-729,2018)利用马尔科夫链收敛至稳定态的原理,多次转移后得到稳定态作为填补的表达值;DCA(Eraslan,G.,et al.“Single-cell RNA-seq denoising using a deepcount autoencoder(使用深度计数自编码器对单细胞RNA测序数据去噪)”NatureCommunications 10,390,2019),scVI(Lopez,R.,et al.“Deep generative modeling forsingle-cell transcriptomics(单细胞转录组的深度生成模型)”Nature Methods 15,1053-1058,2018),scScope(Deng,Y.,et al.“Scalable analysis of cell-typecomposition from single-cell transcriptomics using deep recurrent learning(利用深度循环网络对单细胞转录组的细胞类型组成进行可扩展的分析)”Nature Methods16,311,2019)都基于深度学习,DCA,scVI预先假设表达分布,分别用深度计数自编码器(deep count autoencoder)和变分自编码器(VAE)估计假设分布的参数,scScope不假设分布,基于循环自编码器结构填补表达值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学中山眼科中心,未经中山大学中山眼科中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911072613.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:远程串口调试系统及方法
- 下一篇:一种杨梅蜜饯的生产工艺