[发明专利]基于二代测序的高通量微单倍型检测分型系统和方法在审
申请号: | 202210067126.5 | 申请日: | 2021-01-29 |
公开(公告)号: | CN114420205A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 韩斐然 | 申请(专利权)人: | 杭州联川基因诊断技术有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00;G16B40/30 |
代理公司: | 杭州信与义专利代理有限公司 33450 | 代理人: | 万景旺 |
地址: | 310000 浙江省杭州市杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 二代 通量 微单倍型 检测 系统 方法 | ||
1.一种基于二代测序的微单倍型检测分型系统,其特征在于,包括:
数据输入模块,用于接受样本二代测序比对文件输入;
数据库存储模块,用于存储检测位点列表,所述检测位点包括微单倍型和单独SNP/InDel位点;
MHParser分型模块,分别与所述数据输入模块和所述数据库存储模块连接,用于根据输入的样本二代测序比对文件计算微单倍型位点,并输出微单倍型分型结果;其中,所述微单倍型分型结果包括单倍型信息及计数信息,所述计数信息是指支持相应检测位点的reads数目信息;
MHParser样本相似度计算模块,与所述MHParser分型模块连接,用于接受所述MHParser分型模块输出的微单倍型分型结果,并根据微单倍型分型结果计算任意两个样本之间的相似性分值;
结果输出模块,用于输出所述相似性分值。
2.根据权利要求1所述的微单倍型检测分型系统,其特征在于,所述MHParser样本相似度计算模块还输出样本整合微单倍型序列信息;所述微单倍型检测分型系统还包括:
MHParser多序列比对模块,与所述MHParser样本相似度计算模块连接,用于接受MHParser样本相似度计算模块输出的样本整合微单倍型序列信息,并根据样本整合微单倍型序列信息进行多序列比对,得到样本多序列比对结果;
MHParser样本聚类模块,与所述MHParser多序列比对模块连接,用于接受MHParser多序列比对模块输出的多序列比对结果,并根据所述样本多序列比对结果进行聚类分析;
所述结果输出模块还与所述MHParser样本聚类模块连接,用于样本输出聚类分析结果。
3.根据权利要求1或2所述的微单倍型检测分型系统,其特征在于,所述数据库存储模块还用于存储测序变异检测信息。
4.根据权利要求3所述的微单倍型检测分型系统,其特征在于,所述MHParser分型模块输出位点的基因型。
5.一种基于二代测序的微单倍型检测分型方法,其特征在于,包括以下步骤:
S1,获得检测位点列表和样本二代测序比对文件,所述检测位点包括微单倍型和单独SNP/InDel位点;
S2,利用检测位点列表,根据样本二代测序比对文件计算样本的微单倍型位点,得到微单倍型分型结果,所述微单倍型分型结果包括单倍型信息及计数信息,所述计数信息是指支持相应检测位点的reads数目信息;
S3,根据步骤S2的微单倍型分型结果计算任意两个样本之间的相似性分值。
6.根据权利要求5所述的微单倍型检测分型方法,其特征在于,步骤S3还获得样本整合微单倍型序列信息。
7.根据权利要求6所述的微单倍型检测分型方法,其特征在于,还包括以下步骤:
S4,根据样本整合微单倍型序列信息进行多序列比对,得到多序列比对结果;
S5,根据多序列比对结果进行聚类分析,得到聚类分析结果。
8.根据权利要求5-7任一所述的微单倍型检测分型方法,其特征在于,所述步骤S2中,具体利用以下步骤获得所述微单倍型分型结果:
S21,针对检测位点列表中的任意微单倍型位点,遍历样本二代测序比对文件中的每条序列,根据位点的坐标信息提取reads的碱基组合,得到单倍型,并对具有相同单倍型的reads进行计数;
S22,针对相同单倍型,按照reads数目对不同碱基组合进行排序;
由此得到检测位点列表中所述微单倍型分型结果。
9.根据权利要求5-7任一所述的微单倍型检测分型方法,其特征在于,所述步骤S3中,具体利用以下公式获得所述相似性分值:
S31,按照步骤S2的方法获得多个样本的微单倍型分型结果;
S32,按照下面公式计算任意两个样本间的相似性分值:
其中,
S为相似性分值;
m为位点个数;
C1为常量,取值1,为两个样本某个位点碱基型相同时的打分值;
C2为常量,取值-1,为两个样本某个位点碱基型不同时的打分值;
G1和G2分别为某个位点样本1和样本2的碱基组合数目,其中,样本1为该位点上碱基组合数目较少的样本,样本2为该位点上碱基组合数目较多的样本;G1∩G2表示该位点上两个样本具有相同的碱基组合的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州联川基因诊断技术有限公司,未经杭州联川基因诊断技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210067126.5/1.html,转载请声明来源钻瓜专利网。