[发明专利]确定染色体非整倍性、构建分类模型的方法和装置有效
申请号: | 201980004859.0 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111226281B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 张红云;袁玉英;柴相花;周丽君;王梦杰;刘强;尹烨 | 申请(专利权)人: | 深圳华大医学检验实验室 |
主分类号: | G16B20/10 | 分类号: | G16B20/10 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张立 |
地址: | 518083 广东省深圳市盐*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 染色体 非整倍性 构建 分类 模型 方法 装置 | ||
1.一种确定胎儿是否存在染色体非整倍性的方法,其特征在于,包括:
(1)获取来自孕妇样本的核酸测序数据,所述孕妇样本含有胎儿游离核酸,所述核酸测序数据由多个测序读段构成;
(2)基于所述核酸测序数据确定所述孕妇样本的胎儿浓度以及预定染色体的反估浓度,所述反估浓度是基于所述预定染色体的测序读段数目和第一比较染色体的测序读段数目的差异确定的,所述预定染色体包括待测染色体和第二比较染色体,所述第一比较染色体包括至少一个不同于所述预定染色体的常染色体;
(3)基于所述待测染色体的反估浓度与所述第二比较染色体的反估浓度的差异确定第一特征,基于所述待测染色体的反估浓度与所述胎儿浓度的差异确定第二特征;和
(4)基于所述第一特征和第二特征,利用对照样本的相应数据,确定所述胎儿针对所述待测染色体是否存在非整倍性,其中,所述对照样本包括阳性样本和阴性样本,所述阳性样本针对所述待测染色体具有非整倍性,所述阴性样本针对所述待测染色体不具有非整倍性;
所述胎儿浓度是通过下列步骤确定的:
(a)将来自所述孕妇样本的所述核酸测序数据与参照序列比对,以便确定落入预定窗口的测序读段的数目;和
(b)基于所述落入预定窗口的测序读段的数目,确定所述孕妇样本的胎儿浓度;
所述反估浓度是按照下列公式确定的:
Fj=2*|Rj-Rr|/(Rr)
其中
j表示需要确定所述反估浓度的染色体的编号,
Fj表示第j号染色体的反估浓度,
Rr表示多条常染色体的平均测序读段数目,
Rj表示第j号染色体的测序读段数目;
所述第一特征是通过下列公式确定的:
X1=Fi-Fr
其中
X1表示第一特征,
i表示所述待测染色体的编号,
Fi表示所述待测染色体的反估浓度,
Fr表示第二比较染色体的反估浓度平均值;
所述第二特征是通过下列公式确定的:
其中,
X2表示第二特征,
i表示所述待测染色体的编号,
Fi表示所述待测染色体的反估浓度,
Fa表示所述胎儿浓度。
2.根据权利要求1所述的方法,其特征在于,所述孕妇样本包括孕妇外周血。
3.根据权利要求1所述的方法,其特征在于,所述核酸测序数据是通过双末端测序、单末端测序或者单分子测序获得的。
4.根据权利要求1所述的方法,其特征在于,在步骤(2)中,所述第一比较染色体的测序读段数目为多条常染色体的平均测序读段数目,所述多条常染色体包括至少一个已知不具有非整倍性的常染色体。
5.根据权利要求4所述的方法,其特征在于,在步骤(2)中,所述第一比较染色体的测序读段数目为至少15条常染色体的平均测序读段数目。
6.根据权利要求4所述的方法,其特征在于,第一比较染色体的测序读段数目为至少20条常染色体的平均测序读段数目。
7.根据权利要求4所述的方法,其特征在于,第一比较染色体的测序读段数目为全部常染色体的平均测序读段数目。
8.根据权利要求1所述的方法,其特征在于,在步骤(2)中,所述第二比较染色体包含多个不具有非整倍性的常染色体,并且在步骤(3)中,基于所述待测染色体的反估浓度与所述第二比较染色体的反估浓度平均值的差异确定第一特征。
9.根据权利要求8所述的方法,其特征在于,所述第二比较染色体包含至少10条常染色体。
10.根据权利要求8所述的方法,其特征在于,所述第二比较染色体包含15条常染色体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大医学检验实验室,未经深圳华大医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980004859.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:制备超吸收性聚合物片材的方法
- 下一篇:在基于区块链的系统中执行映射迭代