[发明专利]一种用于近缘物种鉴别的PCR引物设计方法有效
申请号: | 201310723968.2 | 申请日: | 2013-12-24 |
公开(公告)号: | CN103646193A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 艾海新;刘宏生;张力;赵健 | 申请(专利权)人: | 辽宁大学 |
主分类号: | G06F19/20 | 分类号: | G06F19/20;C12Q1/68;C12N15/11;C12N15/10 |
代理公司: | 沈阳杰克知识产权代理有限公司 21207 | 代理人: | 金春华 |
地址: | 110000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 近缘 物种 鉴别 pcr 引物 设计 方法 | ||
技术领域
本发明涉及一种特异性引物的设计方法,尤其涉及一种用于鉴别近缘物种的PCR引物的设计方法。
背景技术
对于亲缘关系接近的物种的鉴别一直是环境监测、水产品种类鉴别、动植物品种鉴别、病害诊断、进出口检验检疫等领域的一项重要工作。而传统的以形态学为基础的分类鉴别方法具有很多缺陷,例如:多数近缘物种形态差异极小,难以鉴别;有些物种在不同生长时期或不同生长环境中形态差异较大,进一步增加了鉴别难度;作为原料加工后会失去其原有的形态特征,导致形态上难以区分;另外,参与鉴别的人员需要具有较深厚的形态分类学专业知识和经验。这些缺陷对分类鉴别过程造成很大的困难,导致鉴别效率低、准确率低,不能适应快速鉴定、实际需求等问题。
随着分子生物学技术的发展,以及越来越多物种基因组、rDNA、叶绿体基因、线粒体基因测序的完成,以DNA片段作为鉴别物种的分子标记的各类方法不断发展出来。这些技术具有特异性强、准确率高、可重复性强、时间短等特点,已经广泛应用于各类致病微生物、环境微生物、经济作物等的分析鉴定中。而这些技术都依赖于一对或几对针对特定种系(可以包括多个种、属)高度特异性的PCR引物。
由于以下两个原因导致设计这样高度特异性的PCR引物存在困难:一、待鉴别的不同种系亲缘关系接近,他们的基因序列也相似,因此引物必须设计在不同种系基因序列差异较大的位置,这种位置一般位于基因的高变区;二、为了保证引物可以检测到待鉴别种系所有更小的分类单元或个体,引物需要设计在种系内基因差异较小的位置,而这种位置一般位于基因的保守区。对于亲缘关系较近的不同种系,基因的保守区和高变区一般不会发生变化。因此设计出的引物会出现特异性差(引物位于保守区,不能有效区分两个种系,出现假阳性)或敏感性差(引物位于高变区,只能鉴别种系内部分物种,出现假阴性)的问题。因此,设计出符合要求的PCR引物存在一定的难度。
发明内容
本发明的目的是提供一种用于近缘物种鉴别的PCR引物设计方法,本发明解决了特异性引物设计中的技术问题,该方法能快速设计出高特异性高敏感性的用于鉴定某一种系生物的PCR引物,该引物也可以用于鉴别目的种系以及与目的种系亲缘关系较近的种系。
本发明提供的一种用于近缘物种鉴别的PCR引物设计方法,方法包括以下步骤:
1)获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件。
2)以步骤1)中获得的目标种系基因序列之一作为模板序列,确定模板序列中的高度保守区。
确定模板序列中的高度保守区,具体步骤如下:①统计多序列比对文件中每一位中碱基A、T、G、C和空位的百分比,确定模板序列的每个碱基在多序列比对文件中的保守性,以百分比表示;②设定保守性阈值为60%-80%,把模板序列分为保守区域和非保守区域;保守性大于60%-80%的定为保守区域;③在保守区域,对于碱基持续长度小于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,重新划分为非保守区域;④在保守区域,对于碱基持续长度大于或等于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,在其两端分别减去(最小引物长度﹣3’端不允许发生错配区)长度的碱基,即为高度保守区;
所述的最小引物长度是碱基数为15-18bp,所述3’端不允许发生错配区碱基数为0-6bp。
3)以步骤2)中作为模板序列的目标种系基因序列,排除步骤2)中确定的高度保守区,按照常规引物设计方法(可使用Primer3),设计出多个上游引物和多个下游引物,然后计算各引物的敏感性和特异性,排除敏感性和特异性低于设定的的敏感性阈值和特异性阈值(敏感性和特异性的阈值分别为0.5-0.9和0.5-0.9)的上游引物和下游引物。
各引物的敏感性和特异性的计算方法包括以下步骤:①根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中序列在3’端不允许发生错配区(通常为3’端0-6bp)发生错配,记为不匹配;如果引物与多序列比对中序列发生错配的碱基数大于最大允许错配碱基数(通常为0-6bp),记为不匹配;其余情况记为匹配;②对于所有引物计算其敏感性和特异性,引物的敏感性=引物能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物的特异性=引物能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310723968.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:邮件处理方法及系统
- 下一篇:一种餐饮垃圾收运处理管理系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用