[发明专利]一种通过序列预测抗体上结合位点的深度学习方法有效
申请号: | 202011269669.2 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112397139B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 杨跃东;张磐 | 申请(专利权)人: | 中山大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B15/30;G06N3/0464;G06N3/08;G06N3/049 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 510260 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 序列 预测 抗体 结合 深度 学习方法 | ||
1.一种通过序列预测抗体上结合位点的深度学习方法,其特征在于:所述的方法包括如下步骤:
获取抗体上若干个高变区,将若干个高变区串连为一条高变区序列,在不同的高变区序列之间加入一种未知类型的氨基酸作为区分标识;
所述的高变区序列中每个氨基酸的特征包括词嵌入特征、额外特征;将词嵌入特征和额外特征合并得到最后的特征矩阵,并将特征矩阵输入神经网络模型;
所述的神经网络模型采用双向长短期记忆网络与transformer编码器学习高变区序列信息以及不同高变区之间的相互作用信息,预测抗体结合位点;
所述的transformer编码器包括位置编码、多头注意力机制;
所述的位置编码通过正弦和余弦函数来识别高变区序列中不同氨基酸的位置,实现预测抗体上的结合位点;
所述的多头注意力机制通过特征矩阵获取注意力矩阵;
所述的多头注意力机制将特征矩阵分为多个子矩阵,形成多个子空间,实现从不同角度去关注和学习高变区之间的联系,通过以下计算得到:
headi=Attention(QWiQ,KWiK,VWiV)
MutiHead(Q,K,V)=Concat(head1,…,headh)Wo
其中,MutiHead(Q,K,V)表示多头注意力机制的输出,表示注意力矩阵;Q、K、V表示高变区序列的特征矩阵、KT、dk表示特征维度;WiQ、表示W表示神经网络中的权重矩阵;headi表示第i个头的注意力层输出。
2.根据权利要求1所述的通过序列预测抗体上结合位点的深度学习方法,其特征在于:将词嵌入特征合并得到最后的特征矩阵,具体通过神经网络模型中的Embedding层将高变区序列中的每个氨基酸转为一个64维的特征矩阵。
3.根据权利要求2所述的通过序列预测抗体上结合位点的深度学习方法,其特征在于:所述的额外特征包括:PSSM、HHM、SPIDER3;
其中,所述的PSSM通过运行PSI-BLAST生成,每个氨基酸对应一个20维的特征矩阵;
所述的HHM通过运行HHblits生成,每个氨基酸对应一个30维的特征矩阵;
所述的SPIDER3通过蛋白质序列与得到的PSSM和HHM计算得到,每个氨基酸对应一个14维的特征矩阵。
4.根据权利要求3所述的通过序列预测抗体上结合位点的深度学习方法,其特征在于:所述的抗体是一个Y型的分子,由四条多肽链构成,分别为两条相同的重链和轻链,先采用完整的重链和轻链计算出额外特征后再截取高变区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011269669.2/1.html,转载请声明来源钻瓜专利网。