[发明专利]基于生物信息学富集胎儿游离DNA用于拷贝数变异的分析方法有效
申请号: | 202110397074.3 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113270138B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 许雄;胡大辉;丁琳枫;肖锐;李海波;施丹华;田丽蕴;徐军;邱海燕 | 申请(专利权)人: | 杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/20;G16B20/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310030 浙江省杭州市西湖区三*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生物 信息学 富集 胎儿 游离 dna 用于 拷贝 变异 分析 方法 | ||
1.一种基于生物信息学富集胎儿游离DNA用于拷贝数变异的分析方法,其特征在于包括如下步骤:
a.采用基于生物信息学富集胎儿游离DNA的分析方法获得胎儿DNA含量最高的insertsize片段分布范围作为分析的数据;
所述的基于生物信息学富集胎儿游离DNA的分析方法,包括如下步骤:
1)将双端reads不容错比对到参考基因组,记录比对到参考基因组上的染色体、坐标位置和reads的GC;
2)保留双端都比对到参考基因组,且insert size在1kb以内的reads;所述insertsize指一对比对到参考基因组上的reads的双末端的距离;
3)做50~500bp范围内的insert size的频率分布图,得到片段分布规律;
4)以设定bp数为step,分别挑选insert size位于设定区域内的reads;对每个样本计算每条染色体上和每个滑动窗口bin内的reads数、GC,并对每个样本的reads数,用总比对到常染色体的reads数做均一化处理;
5)对每个样本的不同insert size片段分布范围的X染色体的比对上的均一化处理后的reads占总均一化后常染色体的reads的比例计算胎儿DNA含量,选取胎儿DNA含量最高的insert size片段分布范围作为后续分析的数据;
b.挑选出来的reads按设定bin size,设定step,分别计算每个滑动窗口bin内的reads数和GC;
c.将单个样本内的所有read count和GC做点图,横轴为GC,纵轴为RC,RC即为readcount,利用LOESS回归模型,拟合出一条曲线,将每个bin内的GC带入拟合曲线得到拟合预测值P,将所有滑动窗口bin的RC取中位数M,校正因子F即为P与M的比值,每个bin的RC乘以每个bin对应的校正因子F即可得到校正后的RC,即RCcorrected;
d.将待测样本的每个bin内的RCcorrected与同批次的、同文库构建方法、同测序平台、同性别的10个以上样本的每个bin内的RCcorrected取比值的自然对数,得到每个bin的log2ratio;
e.对每条染色体上的每个bin片段化,得到每个片段及其对应的log2ratio数据;
f.得到染色体的每个片段的拷贝数CN;
对于女性待测样本,将每个片段的log2ratio取2的幂然后乘以2,即2*2^(log2ratio),得到1-22号染色体和X染色体的每个片段的拷贝数CN;
对于男性待测样本,将每个片段的log2ratio取2的幂然后乘以2,即2*2^(log2ratio),X和Y染色体的拷贝数计算为2^(log2ratio),得到1-22号染色体、X和Y染色体的每个片段的拷贝数CN;
g.将每个片段的CN与2的差值的绝对值,即可得到嵌合比例MosRatio;
h.过滤掉MosRatio小于0.05的片段,保留MosRatio大于0.05、且片段长度大于1M的片段作为胎源性的拷贝数变异CNV最终结果。
2.根据权利要求1所述的拷贝数变异的分析方法,其特征在于,所述的步骤4)具体为:
以10bp为step,分别挑选50-200,50-210,50-220,50-230,50-240,50-250;60-200,60-210,60-220,60-230,60-240,60-250,…,120-200,120-210,120-220,120-230,120-240,120-250游离DNA片段长度位于这些区域内的rea ds,对每个样本计算每条染色体上和每个滑动窗口bin内的reads数、GC,并对每个样本的reads数,用总比对到常染色体的reads数做均一化处理。
3.根据权利要求1所述的拷贝数变异的分析方法,其特征在于,所述步骤b中,挑选出来的reads按100kb bin size,20kb step,分别计算每个滑动窗口bin内的reads数和GC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院,未经杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110397074.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:媒体数据播放系统、方法及相关装置
- 下一篇:无人机能耗最小化设计方法及装置