[发明专利]一种染色体同线性同源区域的检测方法和系统无效

专利信息
申请号: 200810218339.3 申请日: 2008-12-12
公开(公告)号: CN101561845A 公开(公告)日: 2009-10-21
发明(设计)人: 李俊;白寅琪;李瑞强;王俊;杨焕明;汪建 申请(专利权)人: 深圳华大基因研究院;深圳华大基因科技有限公司
主分类号: G06F19/00 分类号: G06F19/00;C12Q1/68
代理公司: 深圳中一专利商标事务所 代理人: 张全文
地址: 518083广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 染色体 线性 同源 区域 检测 方法 系统
【说明书】:

技术领域

发明属于基因工程领域,尤其涉及一种染色体同线性同源区域的检测方法和系统。

背景技术

基因复制是指DNA片段在基因组中复制出一个或更多的拷贝,这种DNA片段可以是一小段基因组序列、整条染色体、甚至是整个基因组。基因复制是基因组进化最主要的驱动力之一,是产生具有新功能的基因和进化出新物种的主要原因之一。

基因复制现象广泛存在,据估计,酵母基因组在1亿年前发生过一次全基因组的复制。全基因复制现象在脊椎动物体内非常罕见,但是在植物体内却非常普遍。很多植物都在祖先阶段或是近期发生过全基因组复制,如双子叶植物中的祖先基因组复制事件和杨树近期的全基因组复制事件。从化石记录来看,被子植物是在地球上某一时期产生之后,迅速蔓延发展的。呈现出一系列突发的进化特点,包括产生新的组织结构,如原始花瓣,心皮和萼片等。一些研究结果显示,大豆、马铃薯、烟草都发生过近期的全基因组复制事件,而在玉米和葡萄中发生的全基因组复制事件却极其古老。现在人们期望能够通过人工选择农作物品种的基因复制,生产出具有快生长、产量高、个头大等特性的作物。

通过检测基因组序列的同线性同源区域,可以掌握物种基因复制事件。目前,检测基因组序列的同线性同源区域的方法主要是对完整的基因组序列同线性同源区域定位的直接观察(即采用目测的方式),其复杂程度如图4a所示,其中图4a中的每条线表示一对基因的同源关系。比如,拟南芥是第一个基因组完全测序植物,把具有同源关系的一对关系用一个点来代表,沿着染色体具有许多同线性同源区域,这就是全基因组复制的遗留物,然而,由于全基因组复制经常发生在几百万至几亿年之前,其产成的基因的快速和大规模缺失,以及后来又发生的其他复制事件(串联重复和随机转座事件),通过目测从点图或线图中(复杂程度参见图4a)去识别祖先发生的全基因组复制事件变得极其困难。如果在物种内部通过目测识别同线性同源区域已经足够困难的话,那么在物种之间进行同线性同源区域的识别就变得更为困难,而且在一些情况下是完全不可行的。

发明内容

本发明的目的在于提供一种染色体同线性同源区域的检测方法,旨在解决现有的采用目测方式检测染色体同线性同源区域时复杂度高、检测效率低的问题。

本发明是这样实现的,一种染色体同线性同源区域的检测方法,所述方法包括下述步骤:

将参考基因集中的所有参考基因定位到目标基因组上,构成基因拷贝座位;

根据所述基因拷贝座位,将重叠的基因拷贝聚类到一起,形成模糊位点基因代表座位;

根据所述模糊位点代表基因座位,利用动态规划模糊位点定位算法检测染色体的同线性同源区域。

本发明的另一目的在于提供一种染色体同线性同源区域检测系统,所述系统包括:

参考基因定位单元,用于将参考基因集中的所有参考基因定位到目标基因组上,构成基因拷贝座位;

基因拷贝聚类单元,用于根据所述参考基因定位单元得到的基因拷贝座位,将重叠的基因拷贝聚类到一起,形成模糊位点基因代表座位;

同线性检测单元,用于根据所述基因拷贝聚类单元得到的模糊位点代表基因座位,利用动态规划模糊位点定位算法检测染色体的同线性同源区域。

在本发明实施例中,通过将参考基因集中的参考基因定位到目标基因组上,得到基因拷贝座位,再将有重叠的基因拷贝聚类到一起,形成模糊位点代表基因座位,最后根据得到的模糊位点代表基因座位,利用动态规划模糊位点定位算法即可自动检测到染色体的同线性同源区域,且本发明实施例提供的检测方法敏感度高,复杂度低,避免了目测时主观因素对染色体同线性同源区域检测的影响。

附图说明

图1是本发明实施例提供的染色体同线性同源区域的检测方法的实现流程图;

图2是本发明实施例提供的将参考基因集中的所有参考基因定位到目标基因组上的示意图;

图3a是本发明实施例提供的原始的在两个染色体上的模糊位点代表基因座位的示意图;

图3b是本发明实施例提供的根据图3a所示的原始的在两个染色体上的模糊位点代表基因座位进行打分的实现示意图;

图3c是本发明实施例提供的根据图3b所示得打分过程得到的分值和打分路径示意图;

图3d是本发明实施例提供的根据图3c所示的最优打分路径得到的染色体同线性同源的基因示意图;

图4a是现有技术提供的通过目测方式检测染色体同线性同源区域的结果示意图;

图4b是本发明实施例提供的染色体同线性同源区域检测方法的检测结果示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因研究院;深圳华大基因科技有限公司,未经深圳华大基因研究院;深圳华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810218339.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top