[发明专利]一种染色体同线性同源区域的检测方法和系统无效
申请号: | 200810218339.3 | 申请日: | 2008-12-12 |
公开(公告)号: | CN101561845A | 公开(公告)日: | 2009-10-21 |
发明(设计)人: | 李俊;白寅琪;李瑞强;王俊;杨焕明;汪建 | 申请(专利权)人: | 深圳华大基因研究院;深圳华大基因科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;C12Q1/68 |
代理公司: | 深圳中一专利商标事务所 | 代理人: | 张全文 |
地址: | 518083广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 染色体 线性 同源 区域 检测 方法 系统 | ||
技术领域
本发明属于基因工程领域,尤其涉及一种染色体同线性同源区域的检测方法和系统。
背景技术
基因复制是指DNA片段在基因组中复制出一个或更多的拷贝,这种DNA片段可以是一小段基因组序列、整条染色体、甚至是整个基因组。基因复制是基因组进化最主要的驱动力之一,是产生具有新功能的基因和进化出新物种的主要原因之一。
基因复制现象广泛存在,据估计,酵母基因组在1亿年前发生过一次全基因组的复制。全基因复制现象在脊椎动物体内非常罕见,但是在植物体内却非常普遍。很多植物都在祖先阶段或是近期发生过全基因组复制,如双子叶植物中的祖先基因组复制事件和杨树近期的全基因组复制事件。从化石记录来看,被子植物是在地球上某一时期产生之后,迅速蔓延发展的。呈现出一系列突发的进化特点,包括产生新的组织结构,如原始花瓣,心皮和萼片等。一些研究结果显示,大豆、马铃薯、烟草都发生过近期的全基因组复制事件,而在玉米和葡萄中发生的全基因组复制事件却极其古老。现在人们期望能够通过人工选择农作物品种的基因复制,生产出具有快生长、产量高、个头大等特性的作物。
通过检测基因组序列的同线性同源区域,可以掌握物种基因复制事件。目前,检测基因组序列的同线性同源区域的方法主要是对完整的基因组序列同线性同源区域定位的直接观察(即采用目测的方式),其复杂程度如图4a所示,其中图4a中的每条线表示一对基因的同源关系。比如,拟南芥是第一个基因组完全测序植物,把具有同源关系的一对关系用一个点来代表,沿着染色体具有许多同线性同源区域,这就是全基因组复制的遗留物,然而,由于全基因组复制经常发生在几百万至几亿年之前,其产成的基因的快速和大规模缺失,以及后来又发生的其他复制事件(串联重复和随机转座事件),通过目测从点图或线图中(复杂程度参见图4a)去识别祖先发生的全基因组复制事件变得极其困难。如果在物种内部通过目测识别同线性同源区域已经足够困难的话,那么在物种之间进行同线性同源区域的识别就变得更为困难,而且在一些情况下是完全不可行的。
发明内容
本发明的目的在于提供一种染色体同线性同源区域的检测方法,旨在解决现有的采用目测方式检测染色体同线性同源区域时复杂度高、检测效率低的问题。
本发明是这样实现的,一种染色体同线性同源区域的检测方法,所述方法包括下述步骤:
将参考基因集中的所有参考基因定位到目标基因组上,构成基因拷贝座位;
根据所述基因拷贝座位,将重叠的基因拷贝聚类到一起,形成模糊位点基因代表座位;
根据所述模糊位点代表基因座位,利用动态规划模糊位点定位算法检测染色体的同线性同源区域。
本发明的另一目的在于提供一种染色体同线性同源区域检测系统,所述系统包括:
参考基因定位单元,用于将参考基因集中的所有参考基因定位到目标基因组上,构成基因拷贝座位;
基因拷贝聚类单元,用于根据所述参考基因定位单元得到的基因拷贝座位,将重叠的基因拷贝聚类到一起,形成模糊位点基因代表座位;
同线性检测单元,用于根据所述基因拷贝聚类单元得到的模糊位点代表基因座位,利用动态规划模糊位点定位算法检测染色体的同线性同源区域。
在本发明实施例中,通过将参考基因集中的参考基因定位到目标基因组上,得到基因拷贝座位,再将有重叠的基因拷贝聚类到一起,形成模糊位点代表基因座位,最后根据得到的模糊位点代表基因座位,利用动态规划模糊位点定位算法即可自动检测到染色体的同线性同源区域,且本发明实施例提供的检测方法敏感度高,复杂度低,避免了目测时主观因素对染色体同线性同源区域检测的影响。
附图说明
图1是本发明实施例提供的染色体同线性同源区域的检测方法的实现流程图;
图2是本发明实施例提供的将参考基因集中的所有参考基因定位到目标基因组上的示意图;
图3a是本发明实施例提供的原始的在两个染色体上的模糊位点代表基因座位的示意图;
图3b是本发明实施例提供的根据图3a所示的原始的在两个染色体上的模糊位点代表基因座位进行打分的实现示意图;
图3c是本发明实施例提供的根据图3b所示得打分过程得到的分值和打分路径示意图;
图3d是本发明实施例提供的根据图3c所示的最优打分路径得到的染色体同线性同源的基因示意图;
图4a是现有技术提供的通过目测方式检测染色体同线性同源区域的结果示意图;
图4b是本发明实施例提供的染色体同线性同源区域检测方法的检测结果示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因研究院;深圳华大基因科技有限公司,未经深圳华大基因研究院;深圳华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810218339.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多模式启动的安全嵌入式系统
- 下一篇:夹紧阀
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用