[发明专利]基于分子标记的免疫组库生物信息分析方法有效
申请号: | 201810618023.7 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108804874B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 王勇斯;李雪飞;温韵洁;董少玲;王晓丹 | 申请(专利权)人: | 广州华银医学检验中心有限公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B20/00;G16B30/10 |
代理公司: | 北京精金石知识产权代理有限公司 11470 | 代理人: | 张黎 |
地址: | 510663 广东省广州市广州高新技术产业开发*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分子标记的免疫组库生物信息分析流程:选取序列相同的单链免疫球蛋白基因,在选取的单链免疫球蛋白基因的3’端或5’端添加引物和结构相同的UMI序列,添加完成后对免疫基因进行PCR扩增得到测试序列,对测试序列进行过滤,过滤之后通过建立有向无环树对免疫基因所带的UMI序列进行校正,之后对经过校正的UMI序列所标记的免疫基因进行校正,组装校正之后的免疫基因,最后对组装的免疫基因进行统计和报告。本发明通过对UMI自身的校正和免疫基因的校正,有效去除扩增错误和测序错误对免疫基因测序的影响,提高了测序数据的准确度。 | ||
搜索关键词: | 免疫基因 校正 免疫球蛋白基因 生物信息分析 测试序列 分子标记 免疫组库 测序 单链 过滤 组装 测序数据 有向无环 准确度 扩增 去除 引物 统计 | ||
【主权项】:
1.基于分子标记的免疫组库生物信息分析方法,其特征在于,包括以下步骤:(1)构建双末端测序所需的测试序列:在单链免疫基因上引入扩增引物和UMI标记序列,进行PCR扩增,得到测试序列;(2)剔除不完整的测试序列:根据是否带有UMI和引物分离步骤(1)所得的测试序列,保留含有UMI和引物的测试序列,去除不带引物或UMI的测试序列;(3)测序质量控制:根据测序质量值对步骤(2)中保留下来的测试序列进行过滤;(4)UMI自身校正:根据不同UMI序列之间的汉明距离和每个UMI所标记的免疫基因序列的种类数,将步骤(3)所得的测试序列分成不同的团簇,团簇的数目就是纠正后UMI的种类数;(5)每个团簇中免疫基因的数目统计:纠正前各个UMI所标记的免疫基因序列的种类数之和就是该UMI所在团簇的免疫基因序列的种类数;(6)每个团簇中免疫基因序列的校正:对同一个团簇中的免疫基因序列采用多序列对比软件muscle进行相互之间的序列对比,如果某个位点的一致性碱基的比例大于0.6,则该位点为该一致性碱基,反之用N代替,得出每个团簇中免疫基因的序列;(7)免疫基因序列组装:将各个团簇上的免疫基因进行组装;(8)统计免疫基因的真实表达量:对步骤(7)中组装好的免疫基因序列进行过滤,除去没有组装序列,并分析不同团簇中免疫基因的相似性,如果一致,则合并,并记录相关的数目信息,即为该基因的真实表达量;(9)统计与报告:采用igblast进行数据库比对注释,分析注释结果分别统计有功能的和没有功能的基因类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华银医学检验中心有限公司,未经广州华银医学检验中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810618023.7/,转载请声明来源钻瓜专利网。