[发明专利]液滴单细胞转录组测序数据降噪方法、装置和存储介质有效
申请号: | 201910537037.0 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110415767B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 古槿;郭文博;王东方;王事成;刘昌毅 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B45/00 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 黄易 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单细胞 转录 序数 据降噪 方法 装置 存储 介质 | ||
本申请涉及一种液滴单细胞转录组测序数据降噪方法、装置、计算机设备和存储介质,首先通过Cell Ranger对液滴进行估计,得到待过滤液滴集合,即Cell Ranger认为包含细胞的液滴的集合,然后根据预设过滤阈值过滤所述待过滤液滴集合中的液滴,实现对细胞质量的控制,这可以降低通过Cell Ranger流程得到的液滴中包含的质量较差的细胞、‘假细胞’、单液滴多细胞等对后续数据分析的影响,之后根据液滴的mRNAs分子的污染分析结果对待规范液滴集合进行基因过滤,得到规范化的液滴集合,完成对液滴单细胞转录组测序数据的规范化处理,这可以去掉与研究问题无关的基因,液滴单细胞测序后续数据分析过程中干扰变量因素的影响。
技术领域
本申请涉及基因测序技术领域,特别是涉及一种液滴单细胞转录组测序数据降噪方法、装置、计算机设备和存储介质。
背景技术
高通量单细胞转录组测序技术(scRNA-seq)使我们可以从单个细胞的精度、全基因组的广度来研究、了解、鉴别和发现在特定环境下不同类型细胞在基因表达谱特征上的差异。这对于我们从单细胞水平认识生命系统、防治疾病,建立起微观基因型与宏观表型的联系,有着重要的意义。
在众多单细胞转录组测序技术中,以油包水的微反应体系为原理的10x GenomicsChromium平台被广泛应用。通过油滴-barcode-单细胞的对应关系,可得到数以万计细胞的单细胞水平的基因表达谱。其自研的单细胞转录组数据处理流程Cell Ranger可以估计“空液滴”(不包含细胞的液滴)和“真实细胞”(包含细胞的液滴)。
但是由于实验技术手段以及估计方法的局限,“真实细胞”中往往会包含质量较差的细胞、单液滴多细胞等情况,对后续分析造成系统偏差,影响最终结果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对数据降噪的液滴单细胞转录组测序数据降噪方法、装置、计算机设备和存储介质。
一种液滴单细胞转录组测序数据降噪方法,所述方法包括:
通过Cell Ranger对液滴进行估计,得到待过滤液滴集合,其中,所述待过滤液滴集合中的待过滤液滴为所述Cell Ranger的估计结果为包含细胞的液滴;
根据预设过滤阈值过滤所述待过滤液滴集合中的待过滤液滴,得到待规范液滴集合,其中,所述预设过滤阈值根据分析所述待过滤液滴的UMI数目、所述待过滤液滴的基因数目、所述待过滤液滴的线粒体基因、所述待过滤液滴的核糖体基因以及受细胞分离影响基因占比中的一个或多个的分析结果设置;
根据液滴的mRNAs分子的污染分析结果对待规范液滴集合中待规范液滴进行基因过滤,得到规范化的液滴集合,其中,所述规范化的液滴集合用于数据分析。
在其中一个实施例中,所述根据预设过滤阈值过滤所述待过滤液滴集合中的待过滤液滴,得到待规范液滴集合,包括:
根据待过滤液滴的UMI数目的箱线图异常值截断点确定UMI数目的过滤上阈值;
使用所述UMI数目的过滤上阈值过滤所述待过滤液滴集合中的待过滤液滴。
在其中一个实施例中,所述根据预设过滤阈值过滤所述待过滤液滴集合中的待过滤液滴,得到待规范液滴集合,包括:
根据待过滤液滴的基因数目的箱线图异常值截断点确定基因数目过滤的上阈值;
使用预设的基因数目的过滤下阈值和所述基因数目过滤的上阈值过滤所述待过滤液滴集合中的待过滤液滴。
在其中一个实施例中,所述根据预设过滤阈值过滤所述待过滤液滴集合中的待过滤液滴,得到待规范液滴集合,包括:
根据待过滤液滴的线粒体基因占比的箱线图异常值截断点确定线粒体基因占比的过滤上阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910537037.0/2.html,转载请声明来源钻瓜专利网。