[发明专利]基于多模态深度编码的抗原免疫原性预测方法和系统有效
申请号: | 202111204465.5 | 申请日: | 2021-10-15 |
公开(公告)号: | CN113762416B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 费才溢;徐实 | 申请(专利权)人: | 南京澄实生物科技有限公司 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G06F18/25;G06F18/2135;G06F18/214;G06N3/04;G06N3/08;G16B30/10 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 刘畅;傅婷婷 |
地址: | 210000 江苏省南京市江北新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 深度 编码 抗原 免疫原性 预测 方法 系统 | ||
1.一种基于多模态深度编码的抗原免疫原性预测方法,其特征在于它包括以下步骤:
S1、特征选择:选定与抗原免疫原性相关的特征,作为待融合特征;待融合特征选择为:肽段序列特征、HLA-I序列特征、抗原受体-肽段互作特征、肽段物理特征、肽段氨基酸组分特征;
S2、归一化处理:设置隐嵌入维度作为不同待融合特征的最终输入维度,将S1中获取的待融合特征进行变换和尺度缩放,获得标准特征;根据S1中特征选择的不同,S2中选定相应的归一化处理方案,以获取格式、维度统一,便于融合的标准特征,具体为:
-序列特征;使用主成分分解PCA对AAindex数据库中的AAindex1数据进行变换,选取变换后的12个主成分特征,为输入的序列进行编码作为序列特征的标准特征;
-互作特征:基于AAindex数据库中的AAindex3矩阵,进行序列比对,获取比对分数,通过尺度缩放获取互作特征的标准特征;
-物理特征:表示序列的电荷、疏水性、不稳定性特征,通过尺度缩放获得物理特征的标准特征;
-组分特征:表示序列氨基酸组分特征,统计其标准氨基酸编码出现的次数作为组分特征的标准特征;
S3、特征融合:将维度相同的标准特征作线性融合操作,融合后的特征向量/矩阵输入深度神经网络,进行非线性变换与融合,获得抗原免疫原性的最终特征分数;
S4、构建预测模型:特征融合,构建包含最终特征分数的预测模型和优化模型;
S5、求解优化模型,获得最优参数的预测模型;
S6、使用最优参数的预测模型进行抗原免疫原性预测。
2.根据权利要求1所述的方法,其特征在于S2中:
肽段序列特征通过以下方法获得标准特征:采用主成分分解PCA对AAindex数据库中的AAindex1特征进行变换,选取变换后的12个主成分特征,对肽段的蛋白组成氨基酸进行编码作为肽段序列特征;
HLA-I序列特征通过以下方法获得标准特征:采用主成分分解PCA对AAindex数据库中的AAindex1特征进行变换,选取变换后的12个主成分特征,对HLA-I序列的蛋白组成氨基酸进行编码作为HLA-I序列特征;
抗原受体-肽段互作特征通过以下方法获得标准特征:基于AAindex数据库中的AAindex3特征,进行序列比对,获取比对分数,通过尺度缩放获得标准化特征,作为抗原受体-肽段互作特征;
肽段物理特征通过尺度缩放获得标准特征,以保证模型训练优化过程的数值稳定性;
肽段氨基酸组分特征通过以下方法获得标准特征:统计肽段中标准氨基酸编码出现的次数,作为肽段氨基酸组分特征。
3.根据权利要求2所述的方法,其特征在于抗原受体-肽段互作特征的尺度变化公式为:
式中,p表示抗原受体-肽段互作分数,p′表示作为标准特征的抗原受体-肽段互作分数。
4.根据权利要求2所述的方法,其特征在于肽段物理特征的尺度变化公式为:
式中,x表示肽段物理特征分数,x′表示作为标准特征的肽段物理特征分数。
5.根据权利要求1所述的方法,其特征在于S3特征融合中,所述线性融合操作包括点乘、或加和、或组合成特征矩阵。
6.根据权利要求1所述的方法,其特征在于S4中构建优化模型:
式中,f是含可学习参数的预测模型;W表示该模型中可学习参数,包括各融合特征获取时方案权重;xn表示输入的特定数据,yn是训练数据中免疫原性可信度数值;N表示样本总数。
7.根据权利要求1所述的方法,其特征在于S5中求解优化模型:多次遍历所有训练数据,利用基于随机梯度优化方法的优化器进行优化,得到最优的模型参数,获得预测模型fW。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京澄实生物科技有限公司,未经南京澄实生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111204465.5/1.html,转载请声明来源钻瓜专利网。