[发明专利]基于分子标记的免疫组库生物信息分析方法有效
申请号: | 201810618023.7 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108804874B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 王勇斯;李雪飞;温韵洁;董少玲;王晓丹 | 申请(专利权)人: | 广州华银医学检验中心有限公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B20/00;G16B30/10 |
代理公司: | 北京精金石知识产权代理有限公司 11470 | 代理人: | 张黎 |
地址: | 510663 广东省广州市广州高新技术产业开发*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 免疫基因 校正 免疫球蛋白基因 生物信息分析 测试序列 分子标记 免疫组库 测序 单链 过滤 组装 测序数据 有向无环 准确度 扩增 去除 引物 统计 | ||
1.基于分子标记的免疫组库生物信息分析方法,其特征在于,包括以下步骤:
(1)构建双末端测序所需的测试序列:在单链免疫基因上引入扩增引物和UMI标记序列,进行PCR扩增,得到测试序列;
(2)剔除不完整的测试序列:根据是否带有UMI和引物分离步骤(1)所得的测试序列,保留含有UMI和引物的测试序列,去除不带引物或UMI的测试序列;
(3)测序质量控制:根据测序质量值对步骤(2)中保留下来的测试序列进行过滤;
(4)UMI自身校正:根据不同UMI序列之间的汉明距离和每个UMI所标记的免疫基因序列的种类数,将步骤(3)所得的测试序列分成不同的团簇,团簇的数目就是纠正后UMI的种类数;
(5)每个团簇中免疫基因的数目统计:纠正前各个UMI所标记的免疫基因序列的种类数之和就是该UMI所在团簇的免疫基因序列的种类数;
(6)每个团簇中免疫基因序列的校正:对同一个团簇中的免疫基因序列采用多序列对比软件muscle进行相互之间的序列对比,如果某个位点的一致性碱基的比例大于0.6,则该位点为该一致性碱基,反之用N代替,得出每个团簇中免疫基因的序列;
(7)免疫基因序列组装:将各个团簇上的免疫基因进行组装;
(8)统计免疫基因的真实表达量:对步骤(7)中组装好的免疫基因序列进行过滤,除去没有组装序列,并分析不同团簇中免疫基因的相似性,如果一致,则合并,并记录相关的数目信息,即为该基因的真实表达量;
(9)统计与报告:采用igblast进行数据库比对注释,分析注释结果分别统计有功能的和没有功能的基因类型。
2.根据权利要求1所述的分析方法,其特征在于,所述步骤(1)中的UMI是结构为UNNNNUNNNNUNNNNU的四个U碱基框架,两两U碱基之间包含四个随机的碱基,该UMI理论种类有412种。
3.根据权利要求1所述的分析方法,其特征在于,所述步骤(1)中的免疫基因是免疫球蛋白M基因、免疫球蛋白G基因、免疫球蛋白A基因、免疫球蛋白D基因和免疫球蛋白E基因中的一种或多种。
4.根据权利要求1所述的分析方法,其特征在于,所述步骤(1)中在且仅在单链免疫基因的一端添加引物和UMI序列,且单链免疫基因3’端和5’端添加相同结构的UMI序列,一条3’端带有引物和UMI的免疫基因序列和一条5’端带引物和UMI的相同序列的免疫基因序列称为一对测试序列。
5.根据权利要求1所述的分析方法,其特征在于,所述步骤(3)对整个测试序列进行测序,通过过滤,保留测序质量值在20以上的测试序列。
6.根据权利要求1所述的分析方法,其特征在于,所述步骤(4)中UMI自身校正过程包括以下步骤:
①建树:将不同的UMI作为不同的节点,连接汉明距离为1的UMI节点,建成多棵有向无环树;
②赋值:对步骤①中建成的有向无环树的节点进行赋值,所赋数值为该UMI所标记的免疫基因序列的种类数;
③砍树:当节点A所赋数值大于与之相连的节点B所赋数值×2+1时,砍除节点A和节点B之间的边;反之,则保留节点A和节点B之间的边;
④形成团簇:对步骤①中所建树上的每个节点都进行步骤③所述的操作,最终将步骤①中所建树分割成多棵新的树,每棵新树就是一个团簇。
7.根据权利要求1所述的分析方法,其特征在于,所述步骤(7)中的组装,对于全长测序,则根据末端重叠区域进行拼接。
8.根据权利要求1所述的分析方法,其特征在于,所述步骤(7)中的组装,对于非全长序列,采用比对imgt数据库中参考序列的方法进行拼接。
9.根据权利要求1所述的分析方法,其特征在于,所述步骤(7)组装的过程中,基因序列存在缺失现象时,根据imgt数据库中的参考序列对缺失部分进行填充。
10.根据权利要求1所述的分析方法,其特征在于,所述步骤(9)中有功能的基因是指免疫基因中的核酸长度是3的倍数且不含终止密码子的CDR3区基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华银医学检验中心有限公司,未经广州华银医学检验中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810618023.7/1.html,转载请声明来源钻瓜专利网。