[发明专利]一种对多物种进行多核苷酸变异鉴定和注释的方法有效
申请号: | 202210435556.8 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114724628B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 龚静;金炜炜;蒋政;曹文 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/30;G16B50/10 |
代理公司: | 武汉宇晨专利事务所(普通合伙) 42001 | 代理人: | 李鹏 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物种 进行 多核苷酸 变异 鉴定 注释 方法 | ||
本发明公开了一种对多物种进行多核苷酸变异鉴定和注释的方法,根据已经定向好的数据集VCF,获得所有双点MNV为数据集TwoPointMNV;将数据集TwoPointMNV中所有鉴定到的双点MNV拆成单点为数据集SNV,并根据数据集SNV从数据集VCF中获取单点的行信息作为数据集SNVInfoVCF;鉴定7位点至2位点MNV,获得鉴定后的MNV并进行基于基因注释、基于非编码区注释和基于调控区注释。本发明支持大于双点的MNV的鉴定,不仅增加鉴定到的MNV的数量,而且也过滤掉原先被错误鉴定的MNV,有效对MNV进行注释。
技术领域
本发明属于生物技术领域,具体的说就是一种对多物种进行多核苷酸变异鉴定和注释的方法
背景技术
近年来,很多国家先后投入大量资金启动精准医疗计划,人类已逐渐走进精准医疗时代。因此,解析不同个体遗传差异,是精准医疗实行的一个重要前提。随着技术发展,获得遗传信息的时间和成本大幅度降低,人类疾病研究中鉴定到了大量的多核苷酸变异(multi-nucleotide variants,MNVs)。MNV指个体中同一个单倍型上同时存在两个或两个以上的核苷酸变异,会导致蛋白质序列的改变,相较于单核苷酸变异(同一个单倍型上单点的核苷酸变异)可能具有更高的致害性。目前,MNV的鉴定还仅仅只涉及到双点MNV的鉴定,而且传统的遗传变异注释工具(数据库和软件)通常无法对大于双点的MNV进行注释。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提供一种对多物种进行多核苷酸变异鉴定和注释的方法,不仅可以获得大于双点的MNV(至多可以鉴定到7个位点MNV),同时也对这些MNV进行功能的注释,方便科研工作者根据科研需求对鉴定和注释后的MNV数据进行筛选、探讨和研究。
本发明为了达到上述发明目的,采用如下技术方案:
一种对多物种进行多核苷酸变异鉴定和注释的方法,包括以下步骤:
步骤1、根据已经定向好的数据集VCF,获得所有双点MNV为数据集TwoPointMNV;
步骤2、将数据集TwoPointMNV中所有鉴定到的双点MNV拆成单点作为数据集SNV,并根据数据集SNV从数据集VCF中获取单点的行信息作为数据集SNVInfoVCF;
步骤3、将数据集SNV复制6份,分别记作第六副本数据集SNV7~第一副本数据集SNV2;
步骤4、鉴定7位点至2位点MNV,获得鉴定后的MNV。
如上所述的步骤4包括以下步骤:
步骤4.1、初始定义副本数据集序号n为6,初始定义位点组合序号m为n+1,初始定义组合合计次数号k为n+1;
步骤4.2、选用第n副本数据集SNV(n+1),以10bp宽度的窗口扫描第n副本数据集SNV(n+1)、枚举所有可能的m位点组合为数据集SNV(n+1)Sub;
步骤4.3、提取数据集SNV(n+1)Sub中第一个m位点组合;
步骤4.4、将该m位点组合拆成单点再从数据集SNVInfoVCF中获取单点的行信息并进行统计:分别统计m位点组合中合计为m~2的次数;
步骤4.5、对统计结果进行判断:如果m位点组合合计为k的次数等于0,那么该m位点组合不是MNV,从数据集SNV(n+1)Sub中删除该m位点组合,提取数据集SNV(n+1)Sub中下一个m位点组合并回到步骤4.4;如果m位点组合合计为k的次数大于0,那么该m位点组合为MNV,保留该m位点组合并追加MNV距离、检测到该MNV的单倍型数量和频率三个信息作为鉴定后的MNV;
步骤4.6、k自减1;
步骤4.7、如果m位点组合合计为k的次数大于0,提取数据集SNV(n+1)Sub中下一个m位点组合并回到步骤4.4;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210435556.8/2.html,转载请声明来源钻瓜专利网。