[发明专利]人类基因突变的HGVS名称生成及分析系统的实现方法有效
申请号: | 201710298386.2 | 申请日: | 2017-05-01 |
公开(公告)号: | CN107122624B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 杨永臣 | 申请(专利权)人: | 杨永臣 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 201802 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人类 基因突变 hgvs 名称 生成 分析 系统 实现 方法 | ||
1.一种基因突变的HGVS名称自动生成的方法:其特征在于,包括如下步骤:
步骤一,先以特定格式描述基因上所发现的变异;
步骤二,将该格式输入突变分析系统,通过HGVS计算程序调用基因信息数据库、基因遗传方式数据库、HGMD数据库进行计算;
步骤三,获得基因变异的HGVS名称和基于HGVS名称的相关信息;
所述突变分析系统还包括数据输入界面、HGVS计算程序及数据输出界面,在数据输入界面,用户需输入:“gene(R/M)S z/c”,数据输入界面支持输入多行数据的分析;gene为基因名称,R为变异位点参考序列,M为变异位点突变序列,S为变异位点之后一段序列,z代表变异位点是纯合型,c代表变异位点是杂合型,z/c应输入单个字母,也可以不输入;
所述HGVS计算程序可将输入的信息转化为HGVS名称,HGVS计算程序可在生成的HGVS名称后,通过该名称从HGMD数据库中调取与该突变有关的信息,这些信息包括:突变的致病性,突变导致的疾病,有关该突变的参考文献;
HGVS计算程序计算后,将计算结果输出到输出界面,包括:突变基因,转录本,核苷酸变化,氨基酸变化,纯合/杂合,遗传方式,HGMD致病性, HGMD疾病,文献;
HGVS名称运算流程如下:
在数据输入环节,用户应输入:“gene(R/M)S z/c”,在此格式中,gene是不可缺失的,且应使用标准的基因名称;R为变异位点参考序列,M为变异位点突变序列,R和M皆可以代表一个碱基,也可以代表多个碱基,R和M在碱基缺失时可以用“-”代替;碱基缺失时,M为“-”,碱基插入时,R为“-”,z/c代表碱基杂合型或纯合型,通过峰图即可简单判断,应输入单个字母,也可以不输入;
对于所输入的信息,HGVS运算程序根据括号中的斜杠两边的碱基数量、是否存在短杠“-”,以及括号后提供的序列在基因组序列中的情况来判断突变型,根据括号后序列在基因组序列中的位置及突变类型来判断突变在CDS坐标上的位置,从而计算出HGVS名称;
通过HGVS计算程序得到某基因某变异的HGVS名称后,可从遵循了HGVS命名规则的变异数据库中检索该变异,找到后从数据库中调取与该变异有关的信息;常用的人类基因变异数据库包括ClinVar,HGMD,都遵循了HGVS突变命名规则;此处以HGMD为例,通过HGVS计算测序所得HGVS名称,可对接HGMD专业版数据,获取相关信息;
对于从数据输入界面输入的基因突变数据,HGVS计算程序计算HGVS名称首先依赖于所输入数据的格式;系统规定的数据输入格式为:
Gene (R/M)S z/c
Gene 为基因的标准名称,R为变异位点参考序列,M为变异位点突变序列,S为变异位点之后一段序列,该序列需为NCBI上gDNA上的一段序列,不拘内含子还是外显子,也不拘5’UTR区域或3’UTR区域,但允许大于10个碱基,如果使用CDS序列,如果圈选序列包含不同外显子,在gDNA序列中不能检索,则无法计算;z/c代表突变为杂合型还是纯合型,可以不填,不同突变类型的输入格式简述如下:
1)碱基置换情况,R和M分别是单个碱基;
2)碱基缺失,缺失时M用“-”表示;
3)碱基插入,R用“-”表示,即序列中在无碱基处出现新的碱基;
4)碱基重复,输入格式与碱基插入相同;
5) 缺失/插入,R和M其中至少一个的碱基数目要大于1,且不构成倒位;
6)倒位,R和M的长度都必须大于1,且等长,且序列为反向,其格式与缺失/插入相同。
2.根据权利要求1所述的一种基因突变的HGVS名称自动生成的方法:其特征在于,所述基因的种属来源包括但不限于各种动物、各种植物、微生物、病毒及人工设计或改造的基因;
所述基因类型包括但不限于:基因组序列,转录本序列,RNA序列,线粒体DNA序列;
就基因组而言,包括但不限于基因的各个组成部分,用于编码蛋白质的外显子区域,不编码蛋白质的外显子区域,内含子区域,5’-UTR区,3’-UTR区,以及其它尚未归类的DNA序列;
就转录本序列而言,包括但不限于每个基因的已有转录本,以及仅在病人身上发现,以及仅在病理部位发现的转录本;
就基因方向而言,包括与编码RNA一致的序列,也包括与编码RNA反向互补的序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杨永臣,未经杨永臣许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710298386.2/1.html,转载请声明来源钻瓜专利网。