[发明专利]用于Sanger测序的深度碱基识别器在审
申请号: | 201980082101.9 | 申请日: | 2019-12-10 |
公开(公告)号: | CN113168890A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 储勇;S·施奈德;R·谢弗;D·吴 | 申请(专利权)人: | 生命科技股份有限公司 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B40/20 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈依心;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 sanger 深度 碱基 识别 | ||
1.一种神经网络控制系统,其包含:
迹线生成器,其耦合到Sanger测序器并生成生物样本的迹线;
划分器,其将所述迹线划分成扫描窗口;
对准器,其用于移位所述扫描窗口;
逻辑,其为所述扫描窗口中的每一个确定相关联的经注释的碱基识别(basecall)以生成用于训练的目标经注释的碱基识别;
双向递归神经网络(BRNN),其包含:
至少一个长短期记忆(LSTM)或通用递归单元(GRU)层;
输出层,其被配置为输出扫描窗口中的所有扫描的扫描标签概率;
CTC损失函数,其用于计算所述输出扫描标签概率与所述目标经注释的碱基识别之间的损失;以及
梯度下降优化器,其被配置为对所述BRNN的闭环反馈控制,以更新所述BRNN的权重,从而针对在每个训练步骤从所述目标经注释的碱基识别中随机选择的小批量的训练样本来使所述损失降至最低。
2.根据权利要求1所述的系统,其进一步包含:
所述扫描窗口中的每一个包含移位250次扫描的500次扫描。
3.根据权利要求1所述的系统,其进一步包含:
聚集器,其用于组装所有扫描窗口的所述标签概率以生成整个迹线的标签概率。
4.根据权利要求3所述的系统,其进一步包含:
出列最大查找器算法,其基于所述CTC损失函数和所述碱基识别的输出来识别所述碱基识别的扫描位置。
5.根据权利要求3所述的系统,其进一步包含:
前缀束搜索解码器,其用于将所述整个迹线的所述标签概率变换为所述生物样本的碱基识别。
6.根据权利要求5所述的系统,其中所述碱基识别位于所述生物样本的5'和3'端。
7.根据权利要求1所述的系统,其中所述迹线是原始染料RFU的序列。
8.根据权利要求1所述的系统,其中所述迹线是从一个或多个毛细管电泳遗传分析仪收集的原始光谱数据。
9.根据权利要求1所述的系统,其进一步包含:
至少一个生成式对抗网络,其被配置为将噪声注入到所述迹线中。
10.根据权利要求1所述的系统,其进一步包含:
至少一个生成式对抗网络,其被配置为将尖峰注入到所述迹线中。
11.根据权利要求1所述的系统,其进一步包含:
至少一个生成式对抗网络,其被配置为将染料斑点伪影注入到所述迹线中。
12.一种过程控制方法,其包含:
操作Sanger测序器以生成生物样本的迹线;
将所述迹线划分为扫描窗口;
移动所述扫描窗口;
针对所述扫描窗口中的每一个确定相关联的经注释的碱基识别以生成目标经注释的碱基识别;
将所述扫描窗口输入到双向递归神经网络(BRNN),其包含:
至少一个长短期记忆(LSTM)或通用递归单元(GRU)层;
输出层,其被配置为输出扫描窗口中的所有扫描的扫描标签概率;
CTC损失函数,其用于计算所述输出扫描标签概率与所述目标经注释的碱基识别之间的损失;以及
通过被配置为闭环反馈控制的梯度下降优化器将所述损失应用于所述BRNN,以更新所述BRNN的权重,从而针对在每个训练步骤从所述目标经注释的碱基识别中随机选择的小批量的训练样本来使所述损失降至最低。
13.根据权利要求12所述的方法,其进一步包含:
所述扫描窗口中的每一个包含移位250次扫描的500次扫描。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生命科技股份有限公司,未经生命科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980082101.9/1.html,转载请声明来源钻瓜专利网。
- 一种简化的Sanger法基因测序方法
- 一种Sanger测序反应优化剂、应用该优化剂的测序反应体系及测序方法
- 基于Sanger测序灵敏检测人类EGFR基因突变的方法及其试剂盒
- 用于肺癌EGFR基因Sanger测序前样品质控的分子指标、试剂盒及方法
- 一种重叠延伸PCR结合Sanger测序检测不连续多DNA位点的方法
- 基于Sanger测序法对Pax1基因启动子区甲基化多位点的检测方法
- Sanger法检测CNIs药物基因多态性的试剂盒及其使用方法
- 一种检测结直肠癌相关基因变异的引物及其应用
- 检测FANCA基因第14号外显子突变位点c.1235C>T的引物和方法
- Sanger神经网络并行主元抽取的工作模态参数识别方法和系统