[发明专利]用于测序装置的机器学习使能脉冲及碱基判定在审
申请号: | 201980022928.0 | 申请日: | 2019-01-25 |
公开(公告)号: | CN111971748A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 乔纳森·M·罗斯伯格;迈克尔·梅耶;乌穆特·伊瑟 | 申请(专利权)人: | 宽腾矽公司 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B40/30;G16B40/20;G01N21/64;C12Q1/6869 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 石海霞;金鹏 |
地址: | 美国康*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 装置 机器 学习 脉冲 碱基 判定 | ||
1.一种用于标识核酸的核苷酸的方法,所述方法包括:
使用至少一个计算机硬件处理器执行如下操作:
存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。
2.根据权利要求1所述的方法,其中,所述深度学习模型包括卷积神经网络。
3.根据权利要求1或任何其它前述权利要求所述的方法,其中,所述深度学习模型包括连接时序分类(CTC)-拟合的神经网络模型。
4.根据权利要求1或任何其它前述权利要求所述的方法,其中,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的各自的时间系列值,所述值指示该核苷酸被掺入所述核酸中的概率。
5.根据权利要求1或任何其它前述权利要求所述的方法,还包括:
其中,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的概率,所述概率指示该核苷酸被掺入所述核酸中的概率;并且
所述方法还包括当所述核酸中的多个核苷酸的第一核苷酸被掺入所述核酸中的概率超过阈值概率时,标识所述第一核苷酸。
6.根据权利要求1或任何其它前述权利要求所述的方法,其中,将所述数据作为输入提供至经过训练的深度学习模型包括:
将所述数据编组成多个时间段;以及
将所述多个时间段中的每个时间段的数据作为输入提供至所述经过训练的深度学习模型,以获得用于指示所述核酸的至少一个核苷酸的对应输出。
7.根据权利要求6或任何其它前述权利要求所述的方法,其中,作为输入提供至所述经过训练的深度学习模型的对应于各个时间段的输出指示针对多个核苷酸中的每一个的如下值,所述值指示该核苷酸在该时间段内被掺入所述核酸中的概率。
8.根据权利要求1或任何其它前述权利要求所述的方法,其中,将所述数据作为输入提供至所述经过训练的深度学习模型包括:
标识所述数据的多个部分,每个部分对应于相应的一个核苷酸掺入事件;以及
将所述数据的多个部分中的每一个作为输入提供至所述经过训练的深度学习模型,以获得对应于所述数据的该部分的输出。
9.根据权利要求8或任何其它前述权利要求所述的方法,其中,对应于所述数据的该部分的输出标识被掺入所述核酸中的核苷酸。
10.根据权利要求1或任何其它前述权利要求所述的方法,还包括:
存取在多个核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射获得的训练数据;以及
使用所述训练数据以及指定所述多个核酸中的至少一些核苷酸的信息训练深度学习模型,以获得所述经过训练的深度学习模型。
11.根据权利要求1或任何其它前述权利要求所述的方法,其中,所述光发射响应于光脉冲系列,且针对至少一些光脉冲中的每个光脉冲,所述数据包括在该光脉冲之后的时间段的多个间隔中的每个间隔中所检测到的相应光子数量。
12.一种用于标识核酸的核苷酸的系统,所述系统包括:
至少一个计算机硬件处理器;以及
至少一个非暂态计算机可读存储介质,所述至少一个非暂态计算机可读存储介质存储指令,所述指令在由所述至少一个计算机硬件处理器执行时,使所述至少一个计算机硬件处理器执行如下操作:
存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宽腾矽公司,未经宽腾矽公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980022928.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:来自空中下载信号的振荡器校准
- 下一篇:低合金第三代先进高强度钢和制造方法