[发明专利]一种全外显子组测序数据分析方法在审
申请号: | 201610319415.4 | 申请日: | 2016-05-13 |
公开(公告)号: | CN105930690A | 公开(公告)日: | 2016-09-07 |
发明(设计)人: | 薛成海;雷文婕;刘婷婷 | 申请(专利权)人: | 万康源(天津)基因科技有限公司 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 李成运 |
地址: | 300220 天津市河西区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种全外显子组测序数据分析方法,包括以下步骤:1)测序数据的质控;2)测序数据的基因组映射;3)测序数据找高置信的基因组变异;4)变异位点的注释。本发明通过简单的参数提交完成大规模数据的分析,包括原始数据的质量检测、数据去噪、测序read的基因组映射上游承接下机的原始测序数据,通过参数自动化提交分析模块,完成测序数据的分析,输出候选的致病突变位点和相关基因,为后期的实验验证提供依据。 | ||
搜索关键词: | 一种 全外显子组测 序数 分析 方法 | ||
【主权项】:
一种全外显子组测序数据分析方法,其特征在于,包括以下步骤:1)测序数据的质控:通过对原始测序数据文件中单碱基质量,以及read质量的评估,判断测序数据是否可用于后续分析,同时,筛选去除测序因素产生的数据噪音;2)测序数据的基因组映射:利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果;3)测序数据找高置信的基因组变异:利用GATK包的UnifiedGenotyper方法找基因组上的变异位点,包括SNV和小片段的INDEL;4)变异位点的注释:对变异的候选位点或基因组区间做注释,包含这些变异在基因组的位置、是否影响氨基酸编码、人群频率、对于蛋白质功能是否有害。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万康源(天津)基因科技有限公司,未经万康源(天津)基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610319415.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用