[发明专利]一种用于近缘物种鉴别的PCR引物设计方法有效
申请号: | 201310723968.2 | 申请日: | 2013-12-24 |
公开(公告)号: | CN103646193A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 艾海新;刘宏生;张力;赵健 | 申请(专利权)人: | 辽宁大学 |
主分类号: | G06F19/20 | 分类号: | G06F19/20;C12Q1/68;C12N15/11;C12N15/10 |
代理公司: | 沈阳杰克知识产权代理有限公司 21207 | 代理人: | 金春华 |
地址: | 110000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 近缘 物种 鉴别 pcr 引物 设计 方法 | ||
1.一种用于近缘物种鉴别的PCR引物设计方法,其特征在于,方法包括以下步骤:
1)获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件;
2)以步骤1)中获得的目标种系基因序列之一作为模板序列,确定模板序列中的高度保守区;
3)以步骤2)中作为模板序列的目标种系基因序列,排除步骤2)中确定的高度保守区,按照常规引物设计方法,设计出多个上游引物和多个下游引物,然后,计算各引物的敏感性和特异性,排除敏感性和特异性低于设定的敏感性阈值和特异性阈值的上游引物和下游引物;
4)将剩余的上游引物和下游引物互相配对,产生引物对;然后,① 排除产物大小为负或产物长度范围不在200-2000bp的引物对;② 计算各引物对的敏感性和特异性,排除敏感性和特异性低于设定的敏感性阈值和特异性阈值的引物对;③ 排除不能通过常规引物设计软件检验的引物对;
5)计算步骤4)中获得的剩余引物对中每个引物对的P值,计算公式为:
P=(C!×D!×(A+B)!×(C+D-A-B)!)/(A!×B!×(C-A)!×(D-B)!×(C+D)!);
其中,
A=引物能匹配的目标种系基因序列的个数;
B=引物能匹配的非目标种系基因序列的个数;
C=目标种系基因序列的总个数;
D=非目标种系基因序列的总个数;
然后对步骤4)中获得的剩余引物对中的每个引物对进行聚类分析,把与模板序列结合位置相差小于10个碱基的引物对聚为一类,最后取出每类中P值最小的引物对作为用于近缘物种鉴别的PCR引物。
2.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤3)和步骤4)中所述的敏感性阈值是0.5-0.9,所述的特异性阈值是0.5-0.9。
3.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤2)确定模板序列中的高度保守区,具体步骤如下:① 统计多序列比对文件中每一位中碱基A、T、G、C和空位的百分比,确定模板序列的每个碱基在多序列比对文件中的保守性,以百分比表示;② 设定保守性阈值为60%-80%,把模板序列分为保守区域和非保守区域;保守性大于60%-80%的定为保守区域;③ 在保守区域,对于碱基持续长度小于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,重新划分为非保守区域;④ 在保守区域,对于碱基持续长度大于或等于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,在其两端分别减去(最小引物长度﹣3’端不允许发生错配区)长度的碱基,即为高度保守区。
4.如权利要求3所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:所述的最小引物长度是碱基数为15-18bp,所述3’端不允许发生错配区碱基数为0-6bp。
5.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤3)中各引物的敏感性和特异性的计算方法包括以下步骤:① 根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中的序列在3’端不允许发生错配区发生错配,记为不匹配;如果引物与多序列比对中的序列发生错配的碱基数大于最大允许错配碱基数0-6bp,记为不匹配;其余情况记为匹配;② 对于所有引物计算其敏感性和特异性,引物的敏感性=引物能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物的特异性=引物能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310723968.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:邮件处理方法及系统
- 下一篇:一种餐饮垃圾收运处理管理系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用