[发明专利]基于生物信息学富集胎儿游离DNA用于拷贝数变异的分析方法有效
申请号: | 202110397074.3 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113270138B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 许雄;胡大辉;丁琳枫;肖锐;李海波;施丹华;田丽蕴;徐军;邱海燕 | 申请(专利权)人: | 杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/20;G16B20/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310030 浙江省杭州市西湖区三*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生物 信息学 富集 胎儿 游离 dna 用于 拷贝 变异 分析 方法 | ||
本发明公开了一种基于生物信息学富集胎儿游离DNA用于拷贝数变异的分析方法。本发明选择性挑选双端都比对到参考基因组的主要来自于胎儿的短片段reads,本发明通过计算不同片段长度的均一化后性染色体reads数占总常染色体reads数的占比计算胎儿DNA含量,选取胎儿DNA含量最高的游离DNA片段长度范围做后续非整倍体和CNV分析。本发明可以提高胎儿DNA浓度比例,对于分析胎儿染色体非整倍性、染色体片段拷贝数异常等应用的准确性有极大提高。
技术领域
本发明属于基于NGS测序的无创产前筛查应用生物信息数据分析领域,具体涉及一种基于生物信息学富集胎儿游离DNA用于拷贝数变异的分析方法。
背景技术
1997年,香港中文大学的Denise Lo发现血液中存在来自于胎儿的游离DNA片段,其平均含量大概占母血中总游离DNA含量的13%。通过对怀孕12周以上的孕妇外周血中游离DNA片段分离提取,采用大规模平行测序方法,可准确检测胎儿的染色体和片段拷贝数异常、性别判定、单基因病筛查等。
目前胎儿游离DNA富集主要通过电泳分离法或磁珠富集的实验方法。但由于胎儿的游离DNA片段含量极低,很难分离不同长度的游离DNA片段,且还会造成样本损失。两种富集方法还增加了实验的复杂度和建库时间周期的延长,这两种方法产生的数据会使比对上的reads冗余度升高,同时reads在参考基因组上的分布均一性变差,可导致假阳性率增加。
发明内容
本发明的目的是克服现有技术的不足,考虑随着下一代测序成本的降低,在一定范围内增加测序量,尽可能抽取来自于胎儿的DNA分子,通过生物信息筛选的方法,提高胎儿DNA占比,从而对分析胎儿染色体非整倍体和染色体片段CNV有更高的准确性,同时能够减少因胎儿DNA含量不足带来的重上机或重采血的比例,检测的样本合格率更高,从而进一步降低成本。
因为胎儿血浆游离DNA比母亲游离DNA片段偏短,在不改变实验提取DNA和建库方法的前提下,我们在测序数据层面通过双末端测序,基于两条reads比对到参考基因组上的位置计算片段长度分布。基于片段长度分布,以10bp为step,分别挑选50-200,50-210,50-220,50-230,50-240,50-250;60-200,60-210,60-220,60-230,60-240,60-250;…,120-200,120-210,120-220,120-230,120-240,120-250…游离DNA片段长度位于这些区域内的reads,对每个样本计算每条染色体上和每个滑动窗口内的reads数、GC,并对每个样本的reads数,用总比对到常染色体的reads数做均一化处理。
通过计算不同片段长度的均一化后性染色体reads数占总常染色体reads数的占比计算胎儿DNA含量,选取胎儿DNA含量最高的游离DNA片段长度范围做后续非整倍体和CNV分析
对于常染色体和女性胎儿X染色体,通过计算出来的CNV的拷贝数减掉正常拷贝数2,乘以100%即可得到此CNV的嵌合比例(MosRatio);对于男性胎儿的X染色体和Y染色体,通过计算出来的CNV的拷贝数减掉正常拷贝数1,乘以100%即可得到此CNV的嵌合比例。如果此嵌合比例小于50%,一般反映的是胎儿DNA含量的大小,与胎儿DNA含量成正相关。如果当前样本有较多的CNV(可能包含良性和致病性CNV),所有CNV的嵌合比例的中位数与胎儿DNA含量近似相当。
本发明的具体可选方案:
本发明公开了一种基于生物信息学富集胎儿游离DNA的分析方法,其包括如下步骤:
1)将双端reads不容错比对到参考基因组,记录比对到参考基因组上的染色体、坐标位置和reads的GC;
2)保留双端都比对到参考基因组,且insert size在1kb以内的reads;所述insertsize指一对比对到参考基因组上的reads的双末端的距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院,未经杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110397074.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:媒体数据播放系统、方法及相关装置
- 下一篇:无人机能耗最小化设计方法及装置