[发明专利]一种多基因家族鉴定及进化分析的方法有效
申请号: | 202010251773.2 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111445954B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 高川;陶勇;夏昊强;周煌凯;艾鹏;石悦 | 申请(专利权)人: | 广州基迪奥生物科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B15/20 |
代理公司: | 广州容大知识产权代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
地址: | 510000 广东省广州市广州国*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多基因 家族 鉴定 进化 分析 方法 | ||
1.一种多基因家族鉴定及进化分析的方法,是针对目标物种或者同源物种单个物种内的蛋白基因家族,其特征在于:包括以下步骤:
步骤1,统计基因序列或蛋白质序列信息;
根据目标物种或者同源物种的基因家族成员的基因序列或蛋白质序列信息进行分析;如果没有基因或蛋白质序列信息,可只提供基因名称;
步骤2,针对目标物种或近源物种开展蛋白基因家族鉴定及进化分析;
步骤2.1,蛋白基因家族鉴定;
步骤2.2,蛋白基因家族结构信息分析;
步骤2.3,家族基因成员染色体分布分析;
步骤2.4,预测复制基因事件;
步骤2.5,Motif分析;
步骤2.6,蛋白基因家族进化树分析;
所述步骤2.1蛋白基因家族鉴定,具体包括:
2.1-1,从Pfam数据库获得要分析的目标物种或近源物种的基因家族的保守结构域信息;
2.1-2,采用HMMER软件包中的hmmsearch命令构建已知蛋白质家族的保守结构域的隐马尔科夫模型(Hidden Markov Model,HMM);
2.1-3,通过隐马尔科夫模型,将目标物种或近源物种的蛋白质氨基酸序列与结构域信息进行比对,比对过程中,domE设置为1e-3;
2.1-4,对HMMER序列比对的结果进行筛选,去除比对长度低于HMM模型结构域长度45%的蛋白质序列,同时仅保留可变剪切中蛋白序列长度最长的序列;
2.1-5,用SMART数据库对Pfam数据库鉴定的结果进行验证,2个数据库均鉴定到的基因,鉴定为家族基因进行后续分析;
所述步骤2.4预测复制基因事件,具体包括:
2.4-1,使用blastp软件两两比对参考基因组上所有的编码蛋白的基因序列;
2.4-2,利用MCScanX软件的duplicate gene classifier program程序针对上一步的比对结果进行分析,预测基因复制事件;
2.4-3,预测过程中,设置参数e-value1e-5或e-value1e-10的结果为复制基因,得到的结果分为片段复制(Segmental)、串联复制(Tandem)、近端复制(Proximal)、单拷贝(Singleton)和分散复制(Dispersed)基因。
2.根据权利要求1所述的一种多基因家族鉴定及进化分析的方法,其特征在于:所述步骤2.2蛋白基因家族结构信息分析,至少包括:分析蛋白家族成员的基因结构。
3.根据权利要求1所述的一种多基因家族鉴定及进化分析的方法,其特征在于:所述步骤2.5Motif分析,是利用MEME软件预测蛋白基因家族的motif,motif的最大数量是15,最优化的motif宽度为10-100个氨基酸残基,其余为默认参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州基迪奥生物科技有限公司,未经广州基迪奥生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251773.2/1.html,转载请声明来源钻瓜专利网。