[发明专利]基于深度神经网络的变体分类器在审
申请号: | 201980003278.5 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110832597A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | A·怀斯;K·M·克鲁雅克 | 申请(专利权)人: | 因美纳有限公司 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B20/20 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 变体 分类 | ||
我们介绍了一种使用深度神经网络预测给定变体是否为体细胞变体或种系变体的变体分类器。所述模型具有两个深度神经网络:一个卷积神经网络(CNN)和一个全连接神经网络(FCNN)以及两个输入:一个具有变体的DNA序列和一组与变体相关的元数据特征。元数据特征表示变体的突变特征、读长映射统计资料及发生频率。CNN处理DNA序列并生成中间卷积特征。特征序列来源于将元数据特征与中间卷积特征进行连接。FCNN处理特征序列并产生变体为体细胞变体、种系变体或噪声变体的概率。迁移学习策略用于在两个突变数据集上对模型进行训练。结果确立了基于传统分类器的模型的优势和优越性。
本申请要求以下的优先权或权益:
于2018年4月12日提交的标题为“基于深度神经网络的变体分类器”的美国临时专利申请62/656,741(代理人案卷号:ILLM 1007-1/IP-1681-PRV)及
2018年5月2日提交的标题为“基于深度神经网络的变体分类器”的荷兰申请2020861(代理人案卷号:ILLM 1007-4/IP-1681-NL)。
出于所有目的,所述临时申请特此以引用的方式并入本文中。
技术领域
本公开技术涉及人工智能计算机、数字数据处理系统及相应数据处理方法及智能模拟产品(如基于知识的系统、推理系统及知识获取系统),包括用于不确定性推理的系统(如模糊逻辑系统)、自适应系统、机器学习系统及人工神经网络。本公开技术尤其涉及使用深度神经网络,如卷积神经网络(CNN)及全连接神经网络(FCNN)进行数据分析。
背景技术
不能仅仅因为在本节中提到了本节中所讨论的主题而认为其是现有技术。同样地,也不能认为本节中所提及的或与作为技术背景而提供的主题相关的问题之前已经被现有技术所认可。本节中的主题仅仅代表不同的方法,这些方法本身也可以对应于所述要求保护的技术的实施方式。
下一代测序已经产生了大量的顺序数据用于变体分类。顺序数据彼此高度相关且具有复杂的相互依赖性,这对支持向量机等传统分类器在变体分类任务中的应用产生了障碍。因此,亟需可以从顺序数据中提取出高层特征的高级分类器。
深度神经网络是一类人工神经网络,其采用多个非线性复杂转换层来依次对高层特征进行建模,并通过反向传播提供反馈。深度神经网络已经进化,提供了大规模的训练数据集、并行和分布计算能力以及非常复杂的训练算法。深度神经网络为众多领域(例如:计算机视觉、语音识别和自然语言处理)的重大进步提供了便利。
卷积神经网络和递归神经网络是深度神经网络的组件。卷积神经网络尤其在图像识别方面取得了成功,其架构包括卷积层、非线性层和池化层。递归神经网络被设计成利用输入数据的连续信息,同时,感知器、长短期记忆单元和门控递归单元等构件循环连接。此外,还提出了许多其它新兴的深度神经网络用于有限的场景,例如:深度时空神经网络、多维度递归神经网络和卷积自编码器。
训练深度神经网络的目的是对每一层中的权重参数进行优化,以逐渐将较简单的特征结合到复杂特征当中去,以便可以从数据中学习到最合适的分层表示。优化过程的单个循环如下组织。首先,给定一个训练数据集,正推法依次计算每层中的输出,并将函数信号正向传播至整个网络。在最后的输出层中,目标损失函数测量推断输出和给定标签之间的误差。为了将训练误差降到最低,逆推法使用链式法则反向传播误差信号,并相对于整个神经网络的所有权重计算坡度。最后,基于随机梯度下降,利用优化算法对所述权重参数进行更新。鉴于批量梯度下降为每个完整的数据集进行参数更新,随机梯度下降则通过为每一小组的数据样本进行更新来提供随机近似值。几种优化算法源自于随机梯度下降。例如,在基于梯度的更新频率和矩为每个参数自适应修改学习率的同时,Adagrad和Adam训练算法分别进行随机梯度下降。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因美纳有限公司,未经因美纳有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980003278.5/2.html,转载请声明来源钻瓜专利网。