[发明专利]确定待测核酸样本变异率的方法和系统在审
申请号: | 202010207884.3 | 申请日: | 2020-03-23 |
公开(公告)号: | CN113436679A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 谢震;黄慧雅;廖微曦;曹玉冰;郭亚琨 | 申请(专利权)人: | 北京合生基因科技有限公司;清华大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10;C12Q1/6858 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 肖阳 |
地址: | 102206 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 核酸 样本 变异 方法 系统 | ||
1.一种确定待测核酸样本变异率的方法,其特征在于,包括:
(1)对待检测核酸样本进行测序,以便获得测序结果,所述测序的最低有效深度为10~100,所述测序结果的数据量是基于参考基因组的长度、最低有效测序深度以及预定的可检出变异最低变异率确定的,所述测序结果由多个测序读段构成;
(2)将所述测序结果与所述待测核酸样本的参考基因组序列进行比对,以便获得比对结果,所述比对结果包括匹配测序读段和未匹配测序读段,并基于所述匹配测序读段确定所述测序的建库片段平均长度;
(3)基于所述匹配测序读段与所述建库片段平均长度,分别确定并校正结构变异、单核苷酸和/或小片段变异;
(4)对所述未匹配测序读段进行拼接,并对所述拼接结果与所述待测核酸样本的参考基因组序列进行比对,以便确定外源变异;
(5)将所述结构变异、所述单核苷酸和/或小片段变异、外源变异进行汇总,以便确定所述待测核酸样本的变异率;
任选地,所述待测核酸样本包括病毒基因组。
2.根据权利要求1所述的方法,其特征在于,在进行步骤(2)之前,预先对所述测序结果进行质量评估和筛选,并基于所述筛选结果,重新确定可检出变异最低变异率,如果所述可检出变异最低变异率低于预定的阈值,则在步骤(1)增加所述核酸样本的量。
3.根据权利要求1所述的方法,其特征在于,在步骤(3)中,利用Pindel确定所述结构变异,并且采用所述预定的可检出变异最低变异率的一半作为变异率筛选阈值。
4.根据权利要求1所述的方法,其特征在于,在确定所述结构变异、所述单核苷酸变异和/或所述小片段变异后,对所述变异所涉及的所述测序读段进行二次比对,合并同类型检出变异并校正由于低质量碱基、比对结果误差原因产生的假阳性检测结果。
5.根据权利要求1所述的方法,其特征在于,在步骤(3)中,所述二次比对与步骤(2)中的比对采用不同的软件。
6.根据权利要求1所述的方法,其特征在于,在步骤(3)中,根据公开数据与历史检测数据排除常见变异类型。
7.根据权利要求1所述的方法,其特征在于,在步骤(3)中,采用Mutect2进行所述单核苷酸和/或小片段变异的检测。
8.根据权利要求1所述的方法,其特征在于,进一步将所述未匹配测序读段与其他物种基因组参考序列进行比对,并确定各其他物种来源和未知来源的测序读段比例。
9.根据权利要求1所述的方法,其特征在于,所述其他物种基因组包括人基因组和/或支原体基因组。
10.根据权利要求1所述的方法,其特征在于,在步骤(4)中,基于所述拼接结果,确定可能的来源物种。
11.根据权利要求1所述的方法,其特征在于,进一步包括对所述结构变异和/或外源变异进行PCR验证。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述的确定待测核酸样本变异率的方法。
13.一种电子设备,其特征在于,包括存储器、处理器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-11中任一所述的确定待测核酸样本变异率的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合生基因科技有限公司;清华大学,未经北京合生基因科技有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010207884.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通讯组件及通讯系统
- 下一篇:筛选候选插入片段的方法和系统