[发明专利]易感基因型检测方法在审
申请号: | 201710386766.1 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107292129A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 吴小龙;黄宇 | 申请(专利权)人: | 中国科学院上海药物研究所 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 北京金信知识产权代理有限公司11225 | 代理人: | 刘锋,张晓丹 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因型 检测 方法 | ||
技术领域
本发明涉及生物信息、计算机、医学及基因学技术领域,尤其涉及一种易感基因型检测方法。
背景技术
I型神经纤维瘤(英文:Neurofibromatosis type I,缩写:NF1)的形成与NF1基因蛋白的表达缺失有关,以多发性咖啡牛奶斑、腋窝或腹股沟斑点、多发性皮肤纤维瘤和虹膜Lisch结节为特征。该疾病的外显率为100%、患病率约1/3000,其中30%~50%的病例为自发突变所致,是人类突变率最高的疾病之一。
I型神经纤维瘤的突变率高是由于NF1基因的突变率高,约50%的患者是新突变,且贯穿整个NF1基因。
近年来研究多集中在探索NF1基因的突变热点,但是该研究方向迫切需要快速分析和寻找突变位点的方法。随着生物信息技术的发展,大量的测序数据出现,生物信息的研究也进入了大数据时代。针对大数据分析,需要多个学科人才和多种软件上的衔接和操作,而且操作流程繁琐。目前并没有可以利用生物信息学及大数据分析的高效地分析待检测样本中是否存在I型神经纤维瘤基因的突变位点的方法,无法使寻找NF1突变位点的过程实现自动化。
发明内容
为解决上述问题,本发明提供一种易感基因型检测方法,可以高效地检测出待检测样本中是否存在待检测的基因突变位点,为疾病的临床诊断及产前筛查提供指导。
为实现上述目的,本发明的一种易感基因型检测方法,包括以下步骤:
S1、采集待检测样本,捕获待检测样本的外显子区域序列,构成原始测序数据;
S2、逐一对原始测序数据中的各个序列进行质量检测,根据质量检测的结果,获得符合质量要求的序列,构成初步调整数据;
S3、将初步调整数据中的各个序列与参考基因组序列进行比对,获得比对结果,构成变异检测数据;
S4、对变异检测数据中的各个序列进行变异检测分析,确定变异检测数据中的具有突变基因的基因序列和突变基因对应的突变位点;
S5、对突变位点进行功能性注释,并确定待检测样本中是否包含待检测的易感基因型。
进一步地,待检测的易感基因型为I型神经纤维瘤易感基因型,包括I型神经纤维瘤基因中rs1801052为AA的基因型和rs1129506为AA的基因型。
进一步地,待检测样本为患者体细胞的全外显子组序列。
进一步地,还包括:当确定待检测样本中包含待检测的易感基因型时,根据患者直系亲属的体细胞的全外显子组序列,验证对待检测样本的检测结果。
进一步地,还包括,对已进行功能性注释的带有突变基因的基因序列进行附加检测,获得变异有害性、候选基因、蛋白质突变中的一个或者多个相关检测结果。
进一步地,还包括,对原始测序数据中的各个序列进行质量检测前,先去除各序列的序列接头。
进一步地,原始测序数据中符合质量要求的序列包括含N低于5%,并且碱基质量值高于30的比例(Q30)在80%以上的序列。
进一步地,变异检测分析包括单核苷酸多态性检测、插入及缺失检测和拷贝数变异检测。
进一步地,功能性注释的注释位置包括突变位点的基因区、基因区间和非翻译区。
进一步地,还包括:根据步骤S2-S5的结果分别汇总质量数据报告、对比数据报告、突变数据报告和突变功能评估报告,并根据质量数据报告、对比数据报告、突变数据报告和突变功能评估报告输出易感基因型检测结果报告。
本发明的易感基因型检测方法,通过运用准确高效的生物信息学分析方法,完成从原始基因数据到突变基因的突变位点检测的管道式流程,提高了对待检测样本的突变位点检测分析的效率,降低易感基因型检测的成本。本发明的易感基因型检测方法可植入性强,不但可以作为独立的I型神经纤维瘤易感基因型检测分析方法进行检测,也可植入到其他的分析流程中,作为其他分析流程中的检测部分,并且还可以用于对其他疾病的突变位点进行检测,为疾病的数据挖掘提供准确的资源。
附图说明
图1为本发明的易感基因型检测方法的流程图。
具体实施方式
下面,结合附图,对本发明的结构以及工作原理等作进一步的说明。
如图1所示,本发明的一种易感基因型检测方法,包括以下步骤:
S1、采集待检测样本,捕获待检测样本的外显子区域序列,构成原始测序数据。
S2、逐一对原始测序数据中的各个序列进行质量检测,根据质量检测的结果,获得符合质量要求的序列,构成初步调整数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海药物研究所,未经中国科学院上海药物研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710386766.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用