[发明专利]用于测序装置的机器学习使能脉冲及碱基判定在审
申请号: | 201980022928.0 | 申请日: | 2019-01-25 |
公开(公告)号: | CN111971748A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 乔纳森·M·罗斯伯格;迈克尔·梅耶;乌穆特·伊瑟 | 申请(专利权)人: | 宽腾矽公司 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B40/30;G16B40/20;G01N21/64;C12Q1/6869 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 石海霞;金鹏 |
地址: | 美国康*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 装置 机器 学习 脉冲 碱基 判定 | ||
一种方法,包括:从一个或多个测序装置获得在核苷酸掺入事件期间从与核苷酸相关联的发光标签检测的原始数据;及处理该原始数据以执行由该一个或多个测序装置的学习使能的自动碱基判定模块产生的碱基判定和与该原始数据相关联的实际值的比较,其中该等碱基判定从该原始数据标识一个或多个个体核苷酸。基于该比较,使用至少一些所获得原始数据形成该学习使能的自动碱基判定模块的更新,且使该更新可用于该一个或多个测序装置。
相关申请的交叉引用
本申请依据35U.S.C.§119要求享有2018年1月26日递交的、标题为“MACHINELEARNING ENABLED PULSE AND BASE CALLING FOR SEQUENCING DEVICES(用于测序装置的机器学习使能脉冲和碱基判定)”、序列号为62/622,754的美国临时申请的优先权,该申请的全部内容以引用方式并入本文中。
背景技术
本公开总体上涉及用于生物测序的自动化脉冲及碱基判定方法,且更具体地涉及关于用于测序装置的机器学习使能脉冲及碱基判定。
核酸(例如,脱氧核糖核酸(DNA)、核糖核酸(RNA))的测序包含标识靶核酸中的各个核苷酸。一些核酸测序方法包含在各个核苷酸掺入与靶核酸互补的核酸链中时标识该各个核苷酸。然后,在测序过程期间标识的互补链的核苷酸系列可允许标识靶核酸链的核苷酸序列。
发明内容
根据一个方面,提供了一种用于标识核酸的核苷酸的方法。该方法包括:使用至少一个计算机硬件处理器来执行如下操作:存取在该核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射获得的数据;及将该数据作为输入提供至经过训练的深度学习模型以获得标识该核酸的核苷酸的输出。
根据一个实施例,深度学习模型包括卷积神经网络。根据一个实施例,深度学习模型包括连接时间分类(CTC)拟合的是神经网络模型。
根据一个实施例,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的相应时间系列值,该值指示该核苷酸掺入所述核酸中的概率。根据一个实施例,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的概率,该概率表示该核苷酸被掺入所述核酸中的概率;并且所述方法还包括当所述核酸中的多个核苷酸的第一核苷酸被掺入所述核酸中的概率超过阈值概率时,标识所述第一核苷酸。
根据一个实施例,将所述数据作为输入提供至经过训练的深度学习模型包括:将所述数据编组成多个时间段;以及将所述多个时间段中的每个时间段的数据作为输入提供至所述经过训练的深度学习模型,以获得用于指示所述核酸的至少一个核苷酸的对应输出。根据一个实施例,针对多个核苷酸中的每一个,对应于作为输入提供至所述经过训练的深度学习模型的各自时间段的输出指示如下值:所述值指示该核苷酸在该时间段内被掺入所述核酸中的概率。
根据一个实施例,将所述数据作为输入提供至所述经过训练的深度学习模型包括:标识所述数据的多个部分,每个部分对应于核苷酸掺入事件中的相应一个;以及将所述数据的多个部分中的每一个作为输入提供至所述经过训练的深度学习模型以获得对应于所述数据的该部分的输出。
根据一个实施例,所述方法还包括:存取在多个核酸的核苷酸掺入事件期间从由与核苷酸相关联的发光标签的所检测到的光发射获得的训练数据;以及使用所述训练数据以及指定所述多个核酸中的至少一些核苷酸的信息训练深度学习模型,以获得所述经过训练的深度学习模型。
根据一个实施例,所述光发射响应于光脉冲系列,且针对至少一些光脉冲中的每一个光脉冲,所述数据包括该光脉冲之后的时间段的多个间隔中的每一个中所检测到的各自光子数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宽腾矽公司,未经宽腾矽公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980022928.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:来自空中下载信号的振荡器校准
- 下一篇:低合金第三代先进高强度钢和制造方法