[发明专利]一种单细胞免疫组库测序数据的分析方法有效
申请号: | 201910246761.8 | 申请日: | 2019-03-28 |
公开(公告)号: | CN109979528B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 周煌凯;夏昊强;高川;张羽;陶勇;罗玥;邢燕;曾川川 | 申请(专利权)人: | 广州基迪奥生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;宋静娜 |
地址: | 510000 广东省广州市广州国*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 单细胞 免疫 组库测 序数 分析 方法 | ||
1.一种单细胞免疫组库测序数据的分析方法,其特征在于,包括如下步骤:
步骤S1,对测序仪产生的T/B淋巴细胞基因组序列数据进行数据质量统计与基本质控,以去除含有测序接头、含有未知碱基及低质量的Reads, 筛选出高质量的UMI和高质量的Barcode,得到高质量的reads;
步骤S2, 对步骤S1所得的高质量的reads与参考V(D)J fragments 序列进行序列比对及注释,得到Consensus序列;
步骤S3,对步骤S2拼接得到的Consensus中的CDR3氨基酸序列进行Clonotype分型;
步骤S4,对步骤S3所得样本中的Clonotype进行CDR3、V/J基因、V-J paired特征分析;
步骤S5,将不同样本中的clonotype进行合并,然后进行多样本分析;
所述步骤S2中,序列比对与注释,具体包括:
数据比对:Cell Ranger首先将高质量reads与参考V(D)J fragments 序列进行比对,将至少有15bp比对到该片段区域的paired reads进行保留;
Contig组装:Cell ranger对于通过mapping及UMI的reads可用于进行组装;
Barcode 筛选:Cell ranger对Barcode进行有效性筛选;
组装Contig注释,包括步骤:(1)组装的Contig序列通过Smith-Waterman与germline序列比对,比对到v d j c 区,并进行标记;(2) 序列找起始密码子,寻找CDR3 motif Cys-FGXG/WGXG;(3) 根据以下条件筛选contig标记为productive,条件:跨越v-j区,v区包含起始密码子,包含cdr3区,v-j区不包含终止密码子;
Contig筛选:保留通过Barcode筛选的细胞,并且在Contig注释有2个以上的UMI支持的productive Contig的Contig;
Consensus序列组装注释: 对于Contig筛选后得到的所有Contig进一步拼接,得到样本CDR3支持的Consensus序列。
2.根据权利要求1所述的分析方法,其特征在于,所述步骤S1中,高质量UMI筛选包括步骤:
根据每个UMI的reads支持数,计算Barcode的N50 RPU,在包含50%的reads中,选择最多reads支持的Barcodes,计算第99百分位数的N50 RPU,过滤掉小于第99百分位数的N50 RPU的Barcodes;利用二维高斯混合模型,计算log(N50 RPU per barcode);将较高均值所在的维度的最小RPU作为阈值,若UMI的RPU在阈值之上,则该UMI为高质量UMI;
所述高质量Barcode筛选的标准为:一个Barcode需要有2个以上的高质量UMI支持。
3.根据权利要求1所述的分析方法,其特征在于,所述步骤S3中,Clonotype分型是CellRanger根据拼接得到的Consensus中的CDR3氨基酸序列进行Clonotype分型,其有效Barcode为该Clonotype的丰度。
4.根据权利要求1所述的分析方法,其特征在于,所述步骤S4中,CDR3特征分析结果用CDR3丰度分布图和CDR3碱基序列长度分布图来展示;
V/J基因特征分析,包括对V/J基因丰度分布情况进行统计分析、CDR3 V/J基因序列长度分布情况统计分析及样本间的V/J基因表达水平进行聚类分析;
V-J paired特征分析,包括对V-J paired 丰度分布和频率分布情况进行统计分析。
5.根据权利要求1所述的分析方法,其特征在于,所述步骤S5中,多样本分析包括样本间Clonotypes比较、 Overlapping Clonotype聚类分析及Overlapping Clonotype差异分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州基迪奥生物科技有限公司,未经广州基迪奥生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910246761.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种转录组和代谢组数据关联分析方法及系统
- 下一篇:CNV检测装置