[发明专利]基于量子卷积神经网络的药物结合能预测方法在审
申请号: | 202210833333.7 | 申请日: | 2022-07-15 |
公开(公告)号: | CN116153390A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 何俊杰 | 申请(专利权)人: | 上海图灵智算量子科技有限公司;图灵智算量子科技(北京)有限公司 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B40/00;G16C20/70;G06N3/04;G06N3/08;G06N10/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 卷积 神经网络 药物 结合能 预测 方法 | ||
本发明提供一种基于量子卷积神经网络的药物结合能预测方法,属于量子计算技术领域。该方法将药物分子序列数据、蛋白质序列数据及蛋白质结合口袋序列数据编码为对应的第一量子态、第二量子态、第三量子态,并将上述第一量子态、第二量子态、第三量子态输入至量子卷积神经网络中进行特征提取后融合,测量得到融合特征,从而可预测得到结合能对应的最优值。因为本发明的输入中增加了包含蛋白质分子局部特征的蛋白质结合口袋,因此在量子卷积神经网络特征提取过程中,根据蛋白质结合口袋的重要理化特征,可以更加准确地提取特征,使得药物结合能的预测值更加准确。
技术领域
本发明属于量子计算技术领域,具体涉及一种基于量子卷积神经网络的药物结合能预测方法。
背景技术
蛋白质与配体(药物分子)之间的生物分子识别在药物发现和药物研发中起着至关重要的作用。然而,通过实验来确定蛋白质与配体的结合能会耗费大量的时间和资源。目前,预测结合能的计算方法已经有了许多,其中大多数都需要蛋白质的三维结构,而这种结构并不容易获得。因此,需要利用新方法从序列水平的特征来预测蛋白质与配体的结合亲和力,从而加快药物发现的过程。
卷积神经网络(Convolutional Neural Network,CNN)是经典机器学习技术中一种重要模型,尤其在图像处理和语音识别任务中具有优越性能。卷积神经网络具有两种特殊的网络层:卷积层和池化层,这两种网络层堆叠形成特殊的层级结构,使得卷积神经网络能够高效地从输入数据中提取结构化特征。此外,卷积神经网络所具有局部连接和权值共享的特点降低了网络模型的复杂度,能够显著提升模型的运算效率。
然而,传统的卷积神经网络在处理结构复杂的蛋白质分子及分子量较大的配体时,需要训练大量的参数,并且预测的结合能的准确性较低。
发明内容
本发明提供一种基于量子卷积神经网络的药物结合能预测方法,从而可以大大降低模型训练的参数、提高结合能预测值的准确性。
本发明提供了一种基于量子卷积神经网络的药物结合能预测方法,包括如下步骤:
将药物分子序列数据、蛋白质序列数据及蛋白质结合口袋序列数据编码为对应的第一量子态、第二量子态、第三量子态;
分别将第一量子态、第二量子态、第三量子态输入至量子卷积神经网络中提取特征后融合,测量得到融合特征;以及
将融合特征输入至经典的全连接神经网络中,得到药物结合能对应的预测值。
上述的方法,其中:
量子卷积神经网络包括多个量子卷积层与多个量子池化层;
每个量子卷积层包括单量子比特门或多量子比特门;
每个量子池化层包括双量子比特受控旋转门。
上述的方法,其中:
单量子比特门包括单量子比特旋转门,多量子比特门包括受控非门。
上述的方法,其中:
第一量子态的编码方式包括:
对第一预定长度的药物分子序列数据进行降维、转置,得到对应的第一半正定矩阵;以及
对第一半正定矩阵进行归一化处理,得到第一量子态对应的第一密度矩阵。
上述的方法,其中:
第二量子态的编码方式包括:
对第二预定长度的蛋白质序列数据进行降维、转置,得到对应的第二半正定矩阵;以及
对第二半正定矩阵进行归一化处理,得到第二量子态对应的第二密度矩阵。
上述的方法,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海图灵智算量子科技有限公司;图灵智算量子科技(北京)有限公司,未经上海图灵智算量子科技有限公司;图灵智算量子科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210833333.7/2.html,转载请声明来源钻瓜专利网。