[发明专利]一种基于snakemake流程的正选择基因的检测方法和系统有效
申请号: | 202110223562.2 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112908410B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 安冬;肖云平;史贤俊;林博;刘钰钏;顾胤聪;鲍志贵;范旭蕾 | 申请(专利权)人: | 上海欧易生物医学科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B25/00;G16B40/30;G16B30/10;G16B50/10 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 201114 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 snakemake 流程 选择 基因 检测 方法 系统 | ||
本发明公开了一种基于snakemake流程的正选择基因的检测方法,能够高效快速鉴定目标物种受正选择基因,为解析物种环境适应性的分子机制、物种演化提供分子依据。本发明还公开了一种实现上述方法的检测系统,所述检测系统具体包括:序列提取模块、基因家族聚类模块、多序列比对模块、基因树构建模块、基因树标记模块、正选择筛选模块。本发明基于snakemake流程的正选择基因的检测方法和检测系统可以高效鉴定目标物种在进化过程中受正选择的基因,对于研究物种对环境适应等演化机制的研究有重要意义。本发明还提出了一种基于snakemake流程的正选择基因的检测系统。
技术领域
本发明属于数据处理技术领域,涉及一种基于snakemake流程的正选择基因的检测方法和系统,包括动植物研究领域进化水平上对受到正选择基因的筛选的流程化体系的建立。
背景技术
物种在进化过程中为适应环境或者受其他因素影响,该物种的某些基因可能发生突变。如果碱基位点的突变不引起编码氨基酸发生改变,则称为同义突变。这种类型的突变多发生在氨基酸密码子的第三位,因密码子简并性而不引起氨基酸发生改变。相反,如果碱基突变导致编码氨基酸发生改变,则称为非同义突变。
当发生非同义突变的基因有利于提高物种的生存力、育性等,那具有该突变基因的个体将比其他个体保留更多的子代。在进化过程中,该突变基因在整个种群中逐渐积累,成为优势位点从而被扩散。所以当氨基酸序列的非同义突变速率(Ka或dN)大于同义突变速率(Ks或dS),即KaKs,就认为该基因受到了正选择(positive selection)。因为正选择基因的突变一般使物种具有某些新的功能,从而适应环境变化。因此研究受正选择基因,对解析物种环境适应的分子机制、阐明物种演化历程具有重要意义。
当发生非同义突变的基因对物种的生存力、育性等有害时,那么具有该基因的个体逐渐被淘汰,突变基因最终也会在整个群体中逐渐被清除。所以当基因发生氨基酸非同义突变的速率小于同义突变速率,即KaKs时,认为该基因受到负选择,又叫清除选择(negative selection,purifying selection)。受清除选择基因的功能一般相对保守。
当发生非同义突变的基因对物种的生存力、育性等既无利也无害时,说明该突变位点对于物种适应环境是中性的,是可有可无的突变。因此氨基酸序列的非同义突变速率等于同义突变速率,即Ka=Ks时,认为该基因受到中性选择(neutral selection)。
现有的正选择基因的检测方法没有完善的通过snakemake搭建的流程,无法实现从基因组和注释文件到筛选出正选择基因的一键化操作。
发明内容
为了解决现有技术存在的不足,本发明的目的是提供一种基于snakemake流程的正选择基因的检测方法和系统,能够高效快速鉴定目标物种受正选择基因,为解析物种环境适应性的分子机制、物种演化提供分子依据。
为了实现上述目的,本发明提出了一种基于snakemake流程的正选择基因的检测方法,包括以下步骤:
步骤一,下载包括目标物种在内的多个物种的基因组序列和注释GFF3文件,目的在于在特定的物种范围内研究目标物种中受正选择的基因;所述特定物种范围是指依据不同项目的要求选择的亲缘关系较近的物种,包括同纲不同目,和/或同目不同科,和/或同科不同属的物种。
步骤二,根据注释GFF3文件中基因的位置从基因组序列中提取基因的CDS序列,并翻译成蛋白。如果基因编码有多个转录本,则取最长转录本的CDS及其编码的蛋白质序列。
步骤三,对CDS序列和蛋白序列重命名,命名规则是在基因ID前添加“物种简称_”(即以“物种简称_基因ID”对CDS序列和蛋白质序列重命名),同时过滤长度小于30个氨基酸的蛋白质序列和非M(M为甲硫氨酸)开头的蛋白质序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海欧易生物医学科技有限公司,未经上海欧易生物医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110223562.2/2.html,转载请声明来源钻瓜专利网。