[发明专利]一种分析处理农作物SSR标记图谱的方法及其装置有效
申请号: | 201611102076.0 | 申请日: | 2016-12-05 |
公开(公告)号: | CN106480215B | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 张宪晨;朱丽;刘越;闫珍臣 | 申请(专利权)人: | 北京华生恒业科技有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C12M1/34 |
代理公司: | 北京精金石专利代理事务所(普通合伙)11470 | 代理人: | 刘晔 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分析 处理 农作物 ssr 标记 图谱 方法 及其 装置 | ||
技术领域
本发明一般地涉及生物遗传学和基因组学领域,并且更特别地,涉及一种分析处理农作物SSR标记图谱的方法及其装置。
背景技术
简单重复序列(Simple Sequence Repeats,SSR),又称微卫星DNA或短串重复序列(Short Tandem Repeat,STR),通常是以2-5个核苷酸为重复单位经10-50次重复串联的DNA序列,如(TC)n、(GATA)n、(GAA)n以及(A)n等。同类的简单重复序列可以分布在整个DNA序列的不同位置上,其长度一般不超过100碱基对(bp)。SSR的长度多态性来源于重复单位拷贝数的个体差异。
相比起其他现有的分子标记技术,如RFLP、PAPD、AFLP以及SNP等,SSR在农作物遗传信息处理方面具有显著的优势:1)SSR在整个DNA序列中有多处分布,数量丰富,能够充分揭示遗传多态性;2)由于具有多等位基因的特性,能够提供更多的遗传信息;3)SSR为共显性遗传,不易被自然和人工选择淘汰;和4)扩增片段短,易于利用PCR扩增及荧光毛细管电泳产生图谱,对所检测的DNA遗传物质的质量和数量要求相对较低,检测操作相对简单,成本相对低廉。利用SSR标记的高多态性,结合相关SSR标记图谱的处理分析手段,可以对不同亲缘农作物物种进行分类,判断其亲缘关系,评价不同农作物品种的异质性,并进而划分杂交优势群。
相对于人类遗传资源的研究,农作物遗传资源的研究相对落后。目前,由于用于农作物SSR标记的引物设计相对匮乏,也没有成熟的试剂盒,经PCR扩增和荧光毛细管电泳产生的SSR标记图谱不但有单峰(纯合子)和双峰(杂合子)还常常存在连续多峰,即一系列等间距、间距不大于2.5bp且峰数大于2的峰,这严重影响SSR标记检测的准确度。
导致连续多峰存在的因素有很多,主要为以下四个方面。N+1峰是连续多峰的主要因素,在用AmpliTaq DNA聚合酶进行PCR扩增时,该酶可以在扩增产物3’端附近加上一个与模板无互补关系的碱基,多数情况下为A,若有的产物不添加,有的产物添加,则会合成长度相差只有1个碱基的两种DNA扩增产物,分别为“N”峰和“N+1”峰。影子(stutter)峰表现为比相应等位基因主峰弱且相差一个或几个重复单元的次峰或递增多峰,其形成原因一般认为是PCR扩增过程中DNA聚合酶在合成DNA时滑动错配所致。还有,当等位基因如一些杂合等位基因距离较近,例如相差1个或2个重复单元时,如果此时又出现stutter峰,那么极有可能导致几个峰连起来形成连续多峰。另外,与人类的个体研究相比,农作物一般都是对一个品种的同质群体的整体描述,而非该品种的一个单株。在当样本纯度较低时,例如品种纯度为90%时,那么很有可能在正常峰附近出现比例大于10%的另外峰,而当纯度更低时则很可能会出现多个杂峰,如果杂峰距离相同则形成连续多峰。
若对连续多峰不加以有效处理会对SSR标记图谱能否被有效读取产生很大影响:一是峰不识别,由于滑动造成单个峰的峰高下降,当峰高低于高低峰的阈值时容易被漏读;二是读峰位置不稳定,最高的子峰不一定落在最右边,如果不定义终点峰的确定位置的规则,会造成不同样品相同峰型的基因型数据有差异;三是读峰不准确,存在多个与最高子峰峰高接近的子峰时,不仅读峰位置有误差而且容易将一个连续多峰识别成多个峰。这些影响会导致农作物SSR标记读取准确性降低,甚至失败。目前本领域缺乏对连续多峰的有效处理,连续多峰时常被直接排除只保留最大峰,或仅仅凭借技术人员的个人经验手动将连续多峰进行调整,如何快速且有效处理农作物SSR标记图谱中出现的连续多峰问题是本领域技术人员面临的挑战。
发明内容
为了解决现有技术无法快速且有效处SSR标记图谱中出现的连续多峰的问题,本发明的目的是提供一种分析处理农作物SSR标记图谱的方法,包括曲线处理、内标校准以及片段分析和基因分型3个主要处理步骤,其特征在于,片段分析处理中还包括连续多峰处理,所述连续多峰处理包括以下步骤:
1)连续多峰识别:扫描整个图谱,识别图谱是否存在一系列等间距、间距不大于2.5bp且峰数大于2的峰,即连续多峰,若存在则前往下一步骤步骤,不存在则结束连续多峰处理;
2)N+1峰识别:从连续多峰的第一个峰开始,如果后峰与本峰的间距在不大于1.2bp则将后峰加入至N+1峰组,若后峰与本峰的间距均大于1.2bp则前往步骤6;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华生恒业科技有限公司,未经北京华生恒业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611102076.0/2.html,转载请声明来源钻瓜专利网。