[发明专利]随机测序方法的碱基识别在审
申请号: | 201780062141.8 | 申请日: | 2017-08-04 |
公开(公告)号: | CN109952382A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | J.曼尼恩;M.马格尔 | 申请(专利权)人: | 豪夫迈·罗氏有限公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 梁谋;黄希贵 |
地址: | 瑞士*** | 国省代码: | 瑞士;CH |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 概率函数 核苷酸 直方图 测序 混合模型 碱基识别 核酸 可用 测量 发射 概率 创建 | ||
1.使用测序单元的方法,所述方法包括:
- 获得测序单元经第一时间间隔从核酸测量的第一组信号值,其中所述第一组信号值包括测序单元的四种单元状态的每一种的测量值,所述四种单元状态对应于不同类型的核苷酸;
- 创建第一组信号值的第一直方图,所述第一直方图是存储多个计数的数据结构,每个计数对应于箱内的多个信号值,第一直方图的每个箱对应于不同的数值;
对于四种单元状态的每种单元状态:
- 确定将处于单元状态的发射概率分配给不同数值的概率函数,使用针对所述第一直方图的箱的多个计数确定概率函数;
- 确定在核酸的四种核苷酸状态之间提供成对转换概率的传输矩阵,四种核苷酸状态对应于不同类型的核苷酸;
- 经T时间步长创建格图,每个时间步长对应于所述第一组信号值的一个信号值,其中给定时间步长的格图包括四种核苷酸状态,每种状态具有使用对应单元状态的概率函数确定的发射概率,并且其中根据成对转换概率,一个时间步长处的核苷酸状态与下一个时间步长处的核苷酸状态连接;
- 基于发射概率和成对转移概率确定通过格图的最佳路径,以鉴定每个时间步长处的核苷酸状态;
- 使用T时间步长的核苷酸状态确定包含核酸序列的碱基;和
- 提供核酸的序列。
2.根据权利要求1所述的方法,其中所述测序单元还包括纳米孔并且具有跨所述测序单元施加的电压,并且其中所述四种单元状态对应于所述纳米孔的孔状态。
3.根据权利要求2所述的方法,其中所述电压包括交流信号,所述交流信号具有相对于参考电压的第一部分和第二部分,并且其中在所述交流信号的第一部分期间测量所述第一组信号值。
4.根据权利要求3所述的方法,其中测序单元包括用于测序核酸的聚合酶,其中核苷酸状态对应于聚合酶的结合状态,并且其中第一组信号值还包括对应于没有标签分子附着至正在纳米孔中穿越的核苷酸的测序单元的第五种单元状态的测量值。
5.根据权利要求4所述的方法,其中所述核苷酸状态对应于包括所述单元状态的亚状态和所述聚合酶的结合状态的系统状态,并且其中所述系统状态包括所述聚合酶的未结合状态和孔状态的穿越状态的组合。
6.根据权利要求1所述的方法,其进一步包括:
- 获得从其他测序单元的其他核酸测量的其他组的信号值;并对于其他测序单元的每一个:
从另一组信号值创建另一个直方图,
使用所述第一直方图确定对所述测序单元特定的概率函数,和
使用对所述测序单元特定的概率函数来确定包含测序单元中核酸序列的碱基。
7.根据权利要求1所述的方法,其中使用第一直方图确定概率函数包括将每个概率函数拟合到第一直方图中的峰。
8.根据权利要求1所述的方法,其中,使用维特比解码器确定通过格图的最佳路径。
9.根据权利要求1所述的方法,其进一步包括:
确定对应于第二时间间隔的第二概率函数,概率函数和第二概率函数形成一组时间依赖性概率函数,其中第二概率函数使用概率函数确定,并且从测序单元经第二时间间隔的核酸测量的第二组信号值确定第二直方图,其中使用时间依赖性概率函数组确定包含核酸序列的碱基。
10.根据权利要求1所述的方法,其中所述测序单元包括用于对所述核酸测序的聚合酶,其中所述第一组信号值包括对所述测序单元的五种结合状态中的每一种的测量值,其中四种结合状态对应于不同类型的核苷酸且第五种结合状态对应于聚合酶活性位点中没有核苷酸,其中四种结合状态共同对应于结合状态,且第五种结合状态是未结合状态,该方法还包括:
- 使用第一分类程序将第一组信号值中的每一个分类为对应于结合状态或未结合状态,其中第一分类程序是2状态分类器;和
- 将信号值的亚组鉴定为对应于结合状态,其中将格图用于确定对应于信号值亚组的核苷酸状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于豪夫迈·罗氏有限公司,未经豪夫迈·罗氏有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780062141.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于多重检测甲基化DNA的方法
- 下一篇:用于预测恩扎妥林活性的方法和组合物