[发明专利]确定重排前V/J基因序列的方法和装置有效
申请号: | 201610075036.5 | 申请日: | 2016-02-03 |
公开(公告)号: | CN107038349B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 张伟;齐彦伟;王长希;刘晓 | 申请(专利权)人: | 深圳华大生命科学研究院 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;C12Q1/68 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 518083 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 重排 基因 序列 方法 装置 | ||
本发明公开一种确定重排前的V和/或J基因序列的方法,包括:(1)获取待测RNA样品的测序数据,测序数据包括来自TCR、BCR和/或Ig的可变区的多个读段;(2)基于测序数据,依据可变区中的V、J与C基因片段的排列关系,确定读段上的来自V/J基因片段的部分,获得多个V/J区部分;(3)从每个V/J区部分取出至少一段序列作为种子序列,获得包含多个种子序列的种子序列集;(4)依据每个种子序列的V/J区部分的支持数目的差异,对V/J区部分进行聚类,获得多个V/J区部分簇;(5)利用每个V/J区部分簇延伸其所支持的种子序列,获得多个候选的重排前V/J基因序;(6)利用读段对候选的重排前V/J基因序列的支持情况进行过滤,以获得重排前的V/J基因序列。
技术领域
本发明属于生物信息领域,具体的,本发明涉及一种确定重排前V/J基因序列的方法和装置。
背景技术
胚系细胞(Germline)上存在一簇V基因、一簇J基因,有的V/J基因之间还有一簇D基因,基因簇中的基因由内含子分开,串联排列在同一条染色体上,并且基因之间的同源性非常的高【动物免疫学[M].中国农业大学出版社,1996.】。一般一个簇里面有几十个基因,且每个基因在不同个体上可能不一样,如人编码抗体的重链(IGH)的V基因簇中有40个基因、D基因簇有25个基因、J基因簇有6个基因,其中40个V基因总共有425个等位基因(allele)。
对于淋巴细胞来说,在细胞发育成熟过程中,V基因、J基因或者D基因会发生基因间的重排【Parkin J,Cohen B.An overview of the immune system[J].The Lancet,2001,357(9270):1777-1789.】,形成编码T细胞受体(TCR)和B细胞受体(BCR)或抗体(Ig)的基因。而这些构成机体免疫系统的B细胞受体/抗体或T细胞受体的集合就形成了免疫组库(immune reperoire)。
免疫球蛋白TCR和BCR的恒定区(C区)比较保守,相对容易测序,很多动物的C区已知。但V,D,J基因区的多样性较高【余江,姚新生.高通量测序分析自身免疫性疾病T细胞受体β链CDR3组库的特征[J].贵州医药,2015,3:037.】;而且,除人类和小鼠外,其他物种的该区域基因还未被找到或者仅仅证明了其中一部分;这些一定程度上阻碍了免疫学研究的进程。例如,猴子是一种可用的疫苗评价和抗体动物模型并被广泛使用。但是猴子的IgH序列【Link J M,Hellinger M A,Schroeder H W.The Rhesus monkey immunoglobulin IGHDand IGHJ germline repertoire[J].Immunogenetics,2002,54(4):240-250.】只有少量被发现,远远达不到分析的要求。因此研究物种的germline序列是一个亟待解决的基本问题。
目前,已有一些方法试图探索germline序列。传统的方法是使用PCR克隆的策略,基于人类基因组DNA序列作为引物进行PCR扩增物种的germline。使用这种方法能测出骆驼【Nguyen V K,Hamers R,Wyns L,et al.Camel heavy‐chain antibodies:diversegermline VHH and specific mechanisms enlarge the antigen‐binding repertoire[J].The EMBO journal,2000,19(5):921-930.】和猴子【Diaz O L,Daubenberger C A,Rodriguez R,et al.Immunoglobulin kappa light-chain V,J,and C gene sequencesof the owl monkey Aotus nancymaae[J].Immunogenetics,2000,51(3):212-218.】的部分germline序列,这是最直接的获得序列的方法,但只适用于和人类同源的物种,并且需要设计多重配对引物且时间长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610075036.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:低位运输车
- 下一篇:一种真空感应熔炼铸片炉更换铜辊辅助装置