[发明专利]基于RAD图谱完善SSR图谱的方法有效
申请号: | 201410393446.5 | 申请日: | 2014-08-12 |
公开(公告)号: | CN104156633B | 公开(公告)日: | 2017-03-01 |
发明(设计)人: | 曾亮;陶晔;陈华;林芹 | 申请(专利权)人: | 上海美吉生物医药科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 南京同泽专利事务所(特殊普通合伙)32245 | 代理人: | 蒋全强 |
地址: | 201321 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于RAD图谱完善SSR图谱的方法,获得样品的SSR图谱和RAD图谱,判断各scaffold所对应的真实连锁群和冲突连锁群,建立SSR连锁群和RAD连锁群的一一对应关系;根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,通过计算确定各scaffold在连锁群内的排列顺序和方向,已建立一一对应关系的SSR连锁群和RAD连锁群,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱,从而得到染色体组装序列。本发明的基于RAD图谱完善SSR图谱的方法将SSR图谱信息和RAD图谱信息整合在一起,相互纠正,相互补充,可以有效地提高图谱精度和图谱长度的。 | ||
搜索关键词: | 基于 rad 图谱 完善 ssr 方法 | ||
【主权项】:
一种基于RAD图谱完善SSR图谱的方法,其特征在于,包括以下具体步骤:A.采用现有的SSR测序方法和RAD测序方法分别对样品进行测序获得样品的SSR图谱和RAD图谱;B.在SSR图谱和RAD图谱中,分别确定标记在各scaffold上的物理位置,统计scaffold在连锁群上的分布,确定scaffold与连锁群的对应关系;C.在SSR图谱和RAD图谱中,判断各scaffold所对应的真实连锁群和冲突连锁群;当真实SSR连锁群和真实RAD 连锁群有共有的scaffold时,建立SSR连锁群和RAD连锁群的一一对应关系;当scaffold有冲突连锁群时,去除冲突连锁群中所述scaffold的标记,得到无冲突的scaffold的标记;D.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离,确定各scaffold在连锁群内的排列顺序;E.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,确定各scaffold在连锁群内的方向;F. 已建立一一对应关系的SSR连锁群和RAD连锁群,根据SSR图谱和RAD图谱中各scaffold在连锁群内的排列顺序和方向,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱;G.将整合图谱中的scaffold连接起来,得到染色体组装序列;所述步骤E中,判断所述scaffold在连锁群内的方向的具体步骤是:分别计算出无冲突的scaffold的标记的遗传距离,将各标记的遗传距离从小到大排列得到标记在连锁群内的遗传距离序号,再根据所述标记在连锁群内的遗传距离序号和在所述scaffold上的物理位置计算出相关系数;所述相关系数的计算公式是:,其中,xi是所述scaffold上的第i个标记的遗传距离序号,yi是所述scaffold上的第i个标记在scaffold上的物理位置,n是所述scaffold上的标记数,rx,y是所述scaffold的相关系数;当相关系数为正数时,所述scaffold的方向是正向的;当相关系数为负数时,所述scaffold的方向是反向的;当无法计算出相关系数时,所述scaffold的方向默认是正向的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美吉生物医药科技有限公司,未经上海美吉生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410393446.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用