[发明专利]一种SNP位点分析方法及系统在审
申请号: | 201811583420.1 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109741788A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 范绍钦 | 申请(专利权)人: | 广州合众生物科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00 |
代理公司: | 广州一锐专利代理有限公司 44369 | 代理人: | 李新梅 |
地址: | 510000 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 分析方法及系统 输出结果 序列末端 样本序列 分析 基因型 去除 标注 统计 | ||
本发明涉及一种SNP位点分析方法及系统。所述的SNP位点分析方法包括:获取标准SNP序列;将标准SNP序列进行标注;获取样本SNP序列;将样本SNP序列进行峰图处理,并标记第二峰;去除样本SNP序列末端的杂峰;将标准SNP序列与样本SNP序列进行对比;统计样本序列的基因型并输出结果。本发明所述的SNP位点分析方法主要对SNP位点进行对比统计与分析。
技术领域
本发明涉及生物信息学、分子生物学、统计学及计算机编程领域,具体涉及一种SNP位点分析方法及系统。
背景技术
SNP为单核苷酸多态性的简称,是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富。现阶段SNP成为第三代遗传标志,是人类基因组计划走向应用的重要步骤。研究表明在人类基因组中每300碱基对就出现一次。大量的SNP位点与人的疾病用药有关。现阶段SNP大量用在高危人群发现、疾病相关基因的鉴定、药物的设计、测试、筛选已有生物学的基础研究等。由于SNP应用的领域广泛检测与筛查的量也随之增大,对于SNP序列的位点基因型数据的分析尤为重要。
现阶段的技术可以查找全基因组外显子基因变异情况,是结合高通量二代测序应用的软件技术,主要是针对原始数据的分析。本发明主要针对已知SNP位点的比对统计分析。
发明内容
本发明解决的技术问题是,提供了一种SNP位点分析方法及系统。所述的一种SNP位点分析方法及系统针对SNP位点进行对比统计与分析。
为了解决上述技术问题,本发明提供的技术方案为:
一种SNP位点分析方法,其包括:
获取标准SNP序列;
将标准SNP序列进行标注;
获取样本SNP序列;
将样本SNP序列进行峰图处理,并标记第二峰;
去除样本SNP序列末端的杂峰;
将标准SNP序列与样本SNP序列进行对比;
统计样本序列的基因型并输出结果。
优选地,所述的将标准SNP序列进行标注,具体为标注基因型及SNP所在基因序列中的位置。获取标准SNP序列进行存储用于后续比对。
优选地,所述的将标准SNP序列进行标注后,将标准SNP序列以多个文件或镜像存储形式进行存储,形成标准数据库。此存储方法有利于数据的查找。
优选地,所述的去除样本SNP序列末端的杂峰后还包括:
将SNP序列进行拼接。可以将完成峰图处理的序列按名称进行拼接。单向不需拼接,双向可以拼接,也可以多个拼接。拼接后形成新序列。直接拼接的系统命名,用名称拼接来显示该名称。
优选地,所述的将标准SNP序列与样本SNP序列进行对比,具体为根据标准SNP序列,在样本SNP序列中显示相对应的位点并用不同颜色标记。
优选地,所述的将标准SNP序列与样本SNP序列进行对比,还包括根据标准序列中的一种基因型,显示该基因型相同的样本序列个数和位置。对比结果用于后续根据将相应要计算的样本数,基因型输入统计计算。
本发明还提供一种SNP位点分析系统,其包括:
标准序列获取模块:所述标准序列获取模块用于获取标准SNP序列;
标准序列标注模块:所述标准序列标注模块用于将标准SNP序列进行标注;
样本序列获取模块:所述样本序列获取模块用于获取样本SNP序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州合众生物科技有限公司,未经广州合众生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811583420.1/2.html,转载请声明来源钻瓜专利网。