[发明专利]基于多模态深度编码的抗原免疫原性预测方法和系统有效

专利信息
申请号: 202111204465.5 申请日: 2021-10-15
公开(公告)号: CN113762416B 公开(公告)日: 2023-05-30
发明(设计)人: 费才溢;徐实 申请(专利权)人: 南京澄实生物科技有限公司
主分类号: G16B15/30 分类号: G16B15/30;G06F18/25;G06F18/2135;G06F18/214;G06N3/04;G06N3/08;G16B30/10
代理公司: 南京天华专利代理有限责任公司 32218 代理人: 刘畅;傅婷婷
地址: 210000 江苏省南京市江北新*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多模态 深度 编码 抗原 免疫原性 预测 方法 系统
【权利要求书】:

1.一种基于多模态深度编码的抗原免疫原性预测方法,其特征在于它包括以下步骤:

S1、特征选择:选定与抗原免疫原性相关的特征,作为待融合特征;待融合特征选择为:肽段序列特征、HLA-I序列特征、抗原受体-肽段互作特征、肽段物理特征、肽段氨基酸组分特征;

S2、归一化处理:设置隐嵌入维度作为不同待融合特征的最终输入维度,将S1中获取的待融合特征进行变换和尺度缩放,获得标准特征;根据S1中特征选择的不同,S2中选定相应的归一化处理方案,以获取格式、维度统一,便于融合的标准特征,具体为:

-序列特征;使用主成分分解PCA对AAindex数据库中的AAindex1数据进行变换,选取变换后的12个主成分特征,为输入的序列进行编码作为序列特征的标准特征;

-互作特征:基于AAindex数据库中的AAindex3矩阵,进行序列比对,获取比对分数,通过尺度缩放获取互作特征的标准特征;

-物理特征:表示序列的电荷、疏水性、不稳定性特征,通过尺度缩放获得物理特征的标准特征;

-组分特征:表示序列氨基酸组分特征,统计其标准氨基酸编码出现的次数作为组分特征的标准特征;

S3、特征融合:将维度相同的标准特征作线性融合操作,融合后的特征向量/矩阵输入深度神经网络,进行非线性变换与融合,获得抗原免疫原性的最终特征分数;

S4、构建预测模型:特征融合,构建包含最终特征分数的预测模型和优化模型;

S5、求解优化模型,获得最优参数的预测模型;

S6、使用最优参数的预测模型进行抗原免疫原性预测。

2.根据权利要求1所述的方法,其特征在于S2中:

肽段序列特征通过以下方法获得标准特征:采用主成分分解PCA对AAindex数据库中的AAindex1特征进行变换,选取变换后的12个主成分特征,对肽段的蛋白组成氨基酸进行编码作为肽段序列特征;

HLA-I序列特征通过以下方法获得标准特征:采用主成分分解PCA对AAindex数据库中的AAindex1特征进行变换,选取变换后的12个主成分特征,对HLA-I序列的蛋白组成氨基酸进行编码作为HLA-I序列特征;

抗原受体-肽段互作特征通过以下方法获得标准特征:基于AAindex数据库中的AAindex3特征,进行序列比对,获取比对分数,通过尺度缩放获得标准化特征,作为抗原受体-肽段互作特征;

肽段物理特征通过尺度缩放获得标准特征,以保证模型训练优化过程的数值稳定性;

肽段氨基酸组分特征通过以下方法获得标准特征:统计肽段中标准氨基酸编码出现的次数,作为肽段氨基酸组分特征。

3.根据权利要求2所述的方法,其特征在于抗原受体-肽段互作特征的尺度变化公式为:

式中,p表示抗原受体-肽段互作分数,p表示作为标准特征的抗原受体-肽段互作分数。

4.根据权利要求2所述的方法,其特征在于肽段物理特征的尺度变化公式为:

式中,x表示肽段物理特征分数,x表示作为标准特征的肽段物理特征分数。

5.根据权利要求1所述的方法,其特征在于S3特征融合中,所述线性融合操作包括点乘、或加和、或组合成特征矩阵。

6.根据权利要求1所述的方法,其特征在于S4中构建优化模型:

式中,f是含可学习参数的预测模型;W表示该模型中可学习参数,包括各融合特征获取时方案权重;xn表示输入的特定数据,yn是训练数据中免疫原性可信度数值;N表示样本总数。

7.根据权利要求1所述的方法,其特征在于S5中求解优化模型:多次遍历所有训练数据,利用基于随机梯度优化方法的优化器进行优化,得到最优的模型参数,获得预测模型fW

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京澄实生物科技有限公司,未经南京澄实生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111204465.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top