[发明专利]一种基于多个基因组比较和二代测序数据的全基因组关联分析方法有效
申请号: | 202110849440.4 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113628685B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 王健;赵均良;杨武;李方平;刘斌;董景芳 | 申请(专利权)人: | 广东省农业科学院水稻研究所 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/20;G16B50/10 |
代理公司: | 湖南楚墨知识产权代理有限公司 43268 | 代理人: | 杜承功 |
地址: | 510640 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 基因组 比较 二代 序数 关联 分析 方法 | ||
本发明公开了一种基于多个基因组比较和二代测序数据的全基因组关联分析方法,步骤一:使用比对软件将参考基因组和从头组装基因组文件进行比对,步骤二:根据插入片段大小及插入到参考基因组的位置,更新参考基因组中的注释基因位置或结构,步骤三:如果有多个从头组装基因组,依次迭代更新参考基因组;步骤四:利用比对软件将样品的二代测序数据比对到更新后的参考基因组上,步骤五,收集所有样品全部结构变异的分界点位置信息至一个集合中,构建群体基因型,步骤六:根据关联位点和更新后的参考基因组注释文件进行功能基因的候选,本发明实现了利用结构变异基因型数据进行全基因组关联分析。
技术领域
本发明涉及基于多个基因组比对的参考基因组及其注释更新、基于二代测序数据的序列结构变异的挖掘、基于多样本基因组结构变异的群体基因型构建以及基于结构变异基因型的全基因组关联分析方法,特别涉及一种基于多个基因组比较和二代测序数据的全基因组关联分析方法,属于生物信息技术领域。
背景技术
全基因组关联分析是对多个个体在全基因组范围的遗传变异多态性进行检测,获得基因型,进而将基因型与可观测的表型进行群体水平的统计学分析,挖掘与性状变异相关的基因。全基因组范围的遗传变异形式多样,有碱基置换变异、插入、缺失、倒位易位等。目前随着二代测序成本降低,基于二代测序技术挖掘基因组遗传变异、构建群体基因型进行全基因组关联分析的研究越来越多。基于二代测序数据挖掘基因组遗传变异需要参考基因组和测序数据,为了获得更丰富更准确的遗传变异,可从参考基因组、样品测序数据和遗传变异检测方法三方面改进:1.为了获得更有利的参考基因组,有研究者提出使用泛基因组作为参考基因组,泛基因组是指群体中全部的基因组序列的总和。通过捕获、呈现群体中全部的基因组变异,为功能基因组学研究提供完整的参考基因组。但是目前构建泛基因组策略有很多不足之处,泛基因组的组织形式也无法统一,由于基因组变异种类多样,表明泛基因组或许不应是线性的,有研究者提出基于图论的基因组,但是多维图形式的泛基因组不容易理解,并且现有的二代测序数据比对到参考基因组上的经典分析软件如BWA也只适用于线性的参考基因组;2.全基因组测序数据方面,相对于三代测序技术、Hi-C技术等,二代测序技术在价格和准确性存在优势,可提供挖掘群体全基因组结构变异的有效测序数据;3.目前利用二代测序数据和线性参考基因组检测结构变异的方法多样,包括依靠测序覆盖深度方法、配对双末端测序方法、序列读长分割的方法和组装的方法,各类方法各有特色,优势劣势并存。本发明创新性利用一种新的策略,把基因组比较得到的结构变异重新整合到参考基因组上,多次迭代获得更新后的参考基因组及其注释,使用比对软件将二代测序数据挂载到参考基因组上,根据覆盖深度重新挖掘序列结构变异并构建群体基因组结构变异基因型用于全基因组关联分析。
发明内容
本发明的目的在于提供一种基于多个基因组比较和二代测序数据的全基因组关联分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于多个基因组比较和二代测序数据的全基因组关联分析方法,所述分析方法步骤如下:
步骤一:使用比对软件将参考基因组和从头组装基因组文件进行比对,获取基因组间的共线性特征,根据共线性特征挖掘结构变异位点,将从头组装基因组中的插入片段插入至参考基因组相应位置中,生成更新后的参考基因组文件;
步骤二:根据插入片段大小及插入到参考基因组的位置,更新参考基因组中的注释基因位置或结构,根据插入片段位置与从头组装基因组中基因注释信息,获得基因结构完全位于插入片段的注释基因并更新到参考基因组中;
步骤三:如果有多个从头组装基因组,依次迭代更新参考基因组;
步骤四:利用比对软件将样品的二代测序数据比对到更新后的参考基因组上,利用序列提取软件提取比对文件的短序列覆盖度,生成覆盖度文件,通过设定覆盖度阈值的方式,判断样品的结构变异情况;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省农业科学院水稻研究所,未经广东省农业科学院水稻研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110849440.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物转盘用水循环装置
- 下一篇:一种枸橼酸托法替布口服溶液及其制备方法