[发明专利]数据处理方法在审
申请号: | 201910795698.3 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110504005A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 杨圳;王文山 | 申请(专利权)人: | 上海其明信息技术有限公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/00 |
代理公司: | 11225 北京金信知识产权代理有限公司 | 代理人: | 刘锋;戎骏京<国际申请>=<国际公布>= |
地址: | 201210 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 安全效益 低成本 测序 细胞 | ||
本发明揭示了一种数据处理方法,具体来说涉及ICB‑scSeq技术中的下机数据的处理方法。使用该数据处理方法,能够低成本地、简单地、快速地进行细胞测序,具有相当大的经济效益和安全效益。
技术领域
本发明涉及一种数据处理方法。具体来说,涉及ICB-scSeq(IntelligentCombinatorial Barcoding-single cell Sequencing,智能组合条形码法单细胞测序)技术中的下机数据的处理方法。
背景技术
在过去十年里,随着第二代测序(next generation sequencing,NGS)技术和第三代测序(third generation sequencing,TGS)技术的飞速发展,引起生命科学领域的巨大变革。以往的研究,需要从大量细胞中获得足够多的核酸进行测序,因此测序结果往往表示的是细胞群体的表征,而单个细胞独有的细胞特性往往被忽略。为了解决上述局限性问题,单细胞测序技术应运而生。
单细胞测序已经在肿瘤、发育生物学、神经科学等领域取得了丰富的成果。而单细胞的研究本可以更为迅速的扩大科学成果,但单细胞测序技术还存在着许多问题,比如需采用新鲜的细胞,样品利用率不高,昂贵的设备及相关试剂等,这对单细胞测序技术的研究和推广带来了很多不便,而对于单细胞生命科学研究的广泛开展也有诸多不利。因此优化开发新的单细胞测序技术,就显得刻不容缓。
ICB-scSeq(Intelligent Combinatorial Barcoding-single cell Sequencing,智能组合条形码法单细胞测序)是由本发明的发明人们研发的单细胞测序技术,它是一种基于SPLIT(split-pool ligation-based transcriptome,基于分割池连接的转录组测序)技术通过组合条形码(combinatorial barcoding)标记RNA细胞起源的单细胞测序的方法。
因此,由于存在上述技术缺陷,在ICB-scSeq的测序方法中,也需要找到一种更好的从原始下机数据到下游分析的数据处理方法,能够低成本地、简单地、快速地进行细胞测序。
发明内容
本发明的一个目的在于克服现有技术的缺陷,提供一种能够低成本地、简单地、快速地进行细胞测序的数据处理方法。
为实现上述目的,本发明提出如下技术方案:一种数据处理方法,其特征在于,包括:
原始数据获取步骤,进行双端测序而对用于智能组合条形码法单细胞测序的原始数据进行获取,第一端为cDNA部分,第二端为特异性分子标签以及细胞条形码部分;
质量控制以及过滤步骤,对所获取的原始数据进行过滤而得到过滤后数据;
比对步骤,将过滤后数据与参考基因组序列进行比对而得到比对后数据;
特异性分子标签去重步骤,对比对后数据中的特异性分子标签重复的部分进行去除而得到去重后数据;
基因定量步骤,对去重后数据进行基因定量而得到定量后数据;
表达矩阵构建步骤,根据定量后数据构建表达矩阵,该表达矩阵包括了每个细胞中的每个基因的原始计数值;
细胞筛选步骤,对表达矩阵的线粒体含量和表达基因数目进行筛选而得到筛选后矩阵;
标准化处理步骤,对筛选后矩阵的原始计数值进行标准化而得到标准化矩阵;
分析步骤,对标准化矩阵进行分析。
根据本发明所提供的数据处理方法,能够低成本地、简单地、快速地进行细胞测序,具有相当大的经济效益和安全效益。
附图说明
图1是本发明的第一实施方式的数据处理方法的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海其明信息技术有限公司,未经上海其明信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910795698.3/2.html,转载请声明来源钻瓜专利网。