[发明专利]一种快速的批量化SNP/Indel引物设计的方法及系统有效
申请号: | 201910798281.2 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110491446B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 田彩霞;董亚晨;刘露露 | 申请(专利权)人: | 上海美吉生物医药科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10 |
代理公司: | 北京哌智科创知识产权代理事务所(普通合伙) 11745 | 代理人: | 何浩 |
地址: | 200120 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 批量 snp indel 引物 设计 方法 系统 | ||
1.一种快速的批量化SNP/Indel引物设计的方法,其特征在于,包括:
对变异检测获得的VCF文件进行标记过滤;
根据标记过滤后所得的变异位点在参考基因组中的位置信息,提取引物设计的任务序列,并基于提取的任务序列结合设定的引物设计参数,生成选定的引物设计软件输入所需格式的输入文件;
使用所述选定的引物设计软件,根据所述输入文件进行引物设计;
对所述选定的引物设计软件完成引物设计后的输出文件,按照预设格式要求进行格式整理,生成最终所需的结果文件;
所述对变异检测获得的VCF文件进行标记过滤,具体为:
将变异检测获得的VCF文件通过VCFtools软件的minDP参数进行标记过滤,筛选出符合预设质量要求的变异位点;
所述根据标记过滤后所得的变异位点在参考基因组中的位置信息,提取引物设计的任务序列,并基于提取的任务序列结合设定的引物设计参数,生成选定的引物设计软件输入所需格式的输入文件,具体为:
基于筛选出的变异位点的染色体位置信息以及变异的碱基详情,提取到参考基因组中变异位点附近预设长度的序列作为引物设计的任务序列;
选择设定的引物设计参数,对提取出的任务序列的格式进行转化,生成选定的引物设计软件输入所需格式的输入文件;
所述选定的引物设计软件为primer3;
所述引物设计参数遵循以下原则:
长度为15-30bp,其有效长度不大于38bp;GC含量在40%-60%之间,PCR扩增中的复性温度是较低Tm值引物的Tm值减去5-10℃,引物长度小于20bp时,其Tm恒等于4×(G+C)+2×(A+T);产物长度在预设范围内,不小于100bp;
所述最终所需的结果文件中的内容包括:
序列编号;
标记在参考基因组序列上的位置;
标记编号,从1开始累加;
标记类型;
参考基因组的基因型;
突变基因型;
标记片段长度;
标记在参考基因组序列上的起始位置;
标记在参考基因组序列上的终止位置;
正向引物序列;
退火温度;
引物的GC含量;
引物片段长度;
反向引物序列;
产物1的片段大小;
产物片段在参考基因组序列上的起始位置;
产物片段在参考基因组序列上的终止位置。
2.一种快速的批量化SNP/Indel引物设计的系统,其特征在于,包括:
信息获取模块,用于获取需要分析的数据信息,所述数据信息包括进行引物设计的VCF文件、参考基因组fasta文件,以及引物设计参数;
标记过滤模块,用于将变异检测获得的VCF文件通过VCFtools软件的minDP参数进行标记过滤,筛选出符合预设质量要求的变异位点;
任务序列提取脚本,用于根据变异位点在参考基因组中的位置信息,提取引物设计的任务序列;
任务序列格式转化脚本,用于结合选定的引物设计参数对提取出的任务序列的格式进行转化,生成选定的引物设计软件输入所需格式的输入文件;
引物设计模块,用于使用所述选定的引物设计软件,根据所述输入文件进行引物设计;
输出文件转化脚本,用于对所述选定的引物设计软件完成引物设计后的输出文件,按照预设格式要求进行格式整理,生成最终所需的结果文件;
所述引物设计参数为流程默认提供或用户自定义设置;
所述选定的引物设计软件为primer3;
所述系统中所利用的工具包括一个Perl编写的主程序代码和两个Perl和shell编写的子程序代码;
所述系统中所使用的每个子程序脚本独立执行或嵌入到已有的数据分析流程中;
基于筛选出的变异位点的染色体位置信息以及变异的碱基详情,提取到参考基因组中变异位点附近预设长度的序列作为引物设计的任务序列;
选择设定的引物设计参数,对提取出的任务序列的格式进行转化,生成选定的引物设计软件输入所需格式的输入文件;
所述引物设计参数遵循以下原则:
长度为15-30bp,其有效长度不大于38bp;GC含量在40%-60%之间,PCR扩增中的复性温度是较低Tm值引物的Tm值减去5-10℃,引物长度小于20bp时,其Tm恒等于4×(G+C)+2×(A+T);产物长度在预设范围内,不小于100bp;
所述最终所需的结果文件中的内容包括:
序列编号;
标记在参考基因组序列上的位置;
标记编号,从1开始累加;
标记类型;
参考基因组的基因型;
突变基因型;
标记片段长度;
标记在参考基因组序列上的起始位置;
标记在参考基因组序列上的终止位置;
正向引物序列;
退火温度;
引物的GC含量;
引物片段长度;
反向引物序列;
产物1的片段大小;
产物片段在参考基因组序列上的起始位置;
产物片段在参考基因组序列上的终止位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美吉生物医药科技有限公司,未经上海美吉生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910798281.2/1.html,转载请声明来源钻瓜专利网。