[发明专利]一种变异序列的注释方法有效
申请号: | 202010450061.3 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111653313B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 文文;王红阳;朱赢;陈淑桢;何慧斯;高勇;汪德鹏 | 申请(专利权)人: | 中国人民解放军海军军医大学第三附属医院;武汉希望组医学检验实验室有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/10 |
代理公司: | 武汉大楚知识产权代理事务所(普通合伙) 42257 | 代理人: | 徐杨松 |
地址: | 201800 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变异 序列 注释 方法 | ||
1.一种变异序列的注释方法,其特征在于,包括以下步骤:
(1)确定变异序列信息
(1.1)获得变异序列:
使用变异分析软件,将待分析序列与参考基因组进行比对,获得变异信息;
(1.2)整合参考序列信息:
获取参考基因组序列以及参考基因组注释文件;根据注释文件,从参考基因组序列中提取参考基因组转录本和CDS序列;
根据基因的描述信息,获取参考基因组中基因对应的Entrez ID信息;
将参考基因组转录本和CDS序列、参考基因组注释文件、Entrez ID信息进行整合,获得整合参考基因组信息;
(1.3)标准化变异信息
对步骤(1.1)中获取的每一个变异信息,提取每个变异的染色体信息、参考基因组物理位置、参考基因组序列、变异序列信息,进行标准化处理,获得标准化变异信息;
所述标准化变异信息包括:染色体信息、起始位置、终止位置、标准化参考基因组序列、标准化变异序列;
(2)变异注释
(2.1)注释功能区域
根据标准化变异信息判断变异与元件相对位置,具体分为:变异位于元件边缘、变异位于元件深处;所述位于元件边缘是指所述变异的起始位置或终止位置距离元件邻近边缘长度小于等于xbp,所述位于元件深处是所述变异的起始位置或终止位置距离元件邻近边缘长度大于xbp;
当位于元件边缘时,进一步区分边缘位点和边缘区域;所述边缘位点是指所述起始位置或终止位置在元件邻近边缘±ybp,所述边缘区域是指所述起始位置或终止位置在元件邻近边缘-ybp至-xbp或+ybp至+xbp的区域,所述y小于x;
所述元件包括UTR、CDS和Intron;
(2.2)注释变异类型
若一个变异的起始、终止位置均位于非CDS区域,注释为空;
若一个变异的起始位置和/或终止位置位于CDS区域内,则将参考cDNA序列翻译为参考氨基酸序列,将参考cDNA中的碱基替换为变异碱基得到变异cDNA序列,并翻译为变异氨基酸序列;然后通过比对参考cDNA序列和变异cDNA序列、参考氨基酸序列和变异氨基酸序列,按照单碱基变异、插入变异和删除变异对变异类型进行分类注释;
(2.3)注释核酸序列变异
对比参考cDNA序列与变异cDNA序列,根据HGVS规则注释变异cDNA序列的核酸变异信息;
(2.4)注释氨基酸序列变异
对比参考氨基酸序列与变异氨基酸序列,根据HGVS规则注释变异氨基酸序列的氨基酸变异信息,其中氨基酸使用三字母缩写表示。
2.根据权利要求1所述的变异序列的注释方法,其特征在于,步骤(1.2)所述提取参考基因组转录本和CDS序列的方法为:
根据参考基因组注释文件,以染色体为单位,从参考基因组序列中提取全部的参考基因组转录本和CDS序列;
或一次性读取全部的参考基因组序列,然后根据参考基因组注释文件,提取参考基因组转录本和CDS序列。
3.根据权利要求1所述的变异序列的注释方法,其特征在于,对于步骤(1.2)所述的整合参考基因组信息,建立信息索引,具体方法为:以染色体为单位,以一定步长,将参考基因组切割为若干窗口,根据参考基因组注释文件,获取每一个窗口所包含的转录本信息。
4.根据权利要求3所述的变异序列的注释方法,其特征在于,所述步长为300kb。
5.根据权利要求1所述的变异序列的注释方法,其特征在于,步骤(1.3)所述标准化处理方法如下:
当参考基因组序列与变异序列的长度同时等于1时,起始位置=终止位置=参考基因组物理位置;
当参考基因组序列与变异序列的长度不同或相同但不等于1时,删除两者中相同的碱基,所删除的参考基因组序列的左侧碱基长度记为LEN,起始位置和终止位置的确定方式如下:
当标准化参考基因组序列长度为0时,起始位置=参考基因组物理位置+LEN-1;当标准化参考基因组序列长度大于0时,起始位置=参考基因组物理位置+LEN;
当标准化参考基因组序列长度小于等于1时,终止位置=起始位置;当标准化参考基因组序列长度大于1时,终止位置=起始位置+标准化参考基因组序列长度-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军海军军医大学第三附属医院;武汉希望组医学检验实验室有限公司,未经中国人民解放军海军军医大学第三附属医院;武汉希望组医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450061.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:射频功率合成自适应调节方法
- 下一篇:一种远传抄表数据的自动校正方法与系统