[发明专利]基于深度神经网络的变体分类器在审
申请号: | 201980003278.5 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110832597A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | A·怀斯;K·M·克鲁雅克 | 申请(专利权)人: | 因美纳有限公司 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B20/20 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 变体 分类 | ||
1.一种由神经网络实现的系统,包括:
变体分类器,在并列运行及耦合到存储器的一个或多个处理器上运行,其具有
卷积神经网络,所述卷积神经网络具有至少两个卷积层,每个卷积层具有至少五个通过一千到数百万个梯度更新迭代训练的卷积层以
处理具有变体的输入序列,在变体的靶位置处,其两侧翼均具有至少10个碱基,及
产生中间卷积特征;
将变体和一组元数据特征相关联的元数据相关器,所述元数据特征表示变体的突变特征、变体的读长映射统计资料及变体的发生频率;及
全连接神经网络,其具有至少两个通过一千到数百万个梯度更新迭代训练的全连接层以
处理来自中间卷积特征和元数据特征组合的特征序列并
输出分类得分,使得所述变体为体细胞变体、种系变体或噪声变体成为可能。
2.根据权利要求1所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与氨基酸影响特征相关联,所述氨基酸影响特征确定所述变体是否为改变密码子的同义突变变体以生成编码不同氨基酸的新密码子。
3.根据权利要求1-2任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与变体类型特征相关联,所述变体类型特征确定变体类型是否为单核苷酸多态性、插入物或缺失物。
4.根据权利要求1-3任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与读长映射统计资料特征相关联,所述读长映射统计资料特征确定识别所述变体的读长映射的质量参数。
5.根据权利要求1-4任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与种群频率特征相关联,所述种群频率特征确定测序种群中变体的等位基因频率。
6.根据权利要求1-5任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与子种群频率特征相关联,所述子种群频率特征确定测序种群分层的种族子种群中变体的等位基因频率。
7.根据权利要求1-6任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与进化保守型特征相关联,所述进化保守型特征确定多个物种靶位置保守型。
8.根据权利要求1-7任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与临床意义特征相关联,所述临床意义特征确定临床测试确定的变体的临床效果、药物敏感性及组织相容性。
9.根据权利要求1-8任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与功能影响特征相关联,所述功能影响特征确定变体对变体所致氨基酸替代物引起的蛋白的功能性的影响。
10.根据权利要求1-9任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与种族划分预测特征相关联,所述种族划分预测特征确定识别个体的种族组成的可能性,个体提供与变体相关的肿瘤样本。
11.根据权利要求1-10任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与肿瘤频率特征相关联,所述肿瘤频率特征确定测序恶性肿瘤中变体的频率。
12.根据权利要求1-11任一项所述的由神经网络实现的系统,其中所述元数据相关器进一步配置为将变体与可变等位基因特征相关联,所述可变等位基因特征确定参考序列中靶位置变体突变形成的至少一个碱基。
13.根据权利要求1-12任一项所述的由神经网络实现的系统,其中在来自第二数据集的500万个训练样本上进行训练后,同时在来自第一数据集致癌突变的50万个训练样本上对变体分类器的卷积神经网络和全连接神经网络进行端对端训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因美纳有限公司,未经因美纳有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980003278.5/1.html,转载请声明来源钻瓜专利网。