[发明专利]抗原肽呈递预测模型的构建方法、抗原肽预测方法及装置有效
申请号: | 202210170086.7 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114242159B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 王天元;翟珂 | 申请(专利权)人: | 北京晶泰科技有限公司 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B35/00;G16B40/00 |
代理公司: | 北京汇鑫君达知识产权代理有限公司 11769 | 代理人: | 刘湘菲 |
地址: | 100083 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抗原 呈递 预测 模型 构建 方法 装置 | ||
本申请涉及一种抗原肽呈递预测模型的构建方法、抗原肽预测方法及装置。该构建方法包括:获取预选种类的目标HLA及与目标HLA对应的具有预设比例的正样本数据和负样本数据;将目标HLA及相应的正样本数据和负样本数据分别输入多种基于BERT模型的不同架构的子模型进行训练,获得多个训练好的子模型;通过预设规则对各训练好的子模型进行筛选,获得包括优选子模型的预测模型;其中,预测模型综合优选子模型的预测呈递结果预测目标抗原肽被目标HLA呈递的结果。本申请提供的方案,能够通过预测模型快速预测抗原肽被HLA呈递的结果,降低研发成本,提高预测效率。
技术领域
本申请涉及抗原肽技术领域,尤其涉及一种抗原肽呈递预测模型的构建方法、抗原肽预测方法及装置。
背景技术
T细胞免疫是适应性免疫的重要组成部分,在对抗病原微生物感染及抗肿瘤中均发挥核心作用。T细胞免疫的关键步骤是TCR(T细胞抗原受体)与相应的pMHC(抗原肽-MHC分子复合物)的相互作用,其中,MHC-Ⅰ类分子通过呈递表位多肽供CTL(细胞毒性T淋巴细胞)识别而引发效应细胞对靶细胞的杀伤。研究抗原肽与MHC分子复合物的结构有助于深入理解T细胞免疫发生的细节和加快T细胞表位疫苗的开发。
人类的MHC分子也被称作HLA分子、HLA或HLA抗原。HLA结合并呈递抗原肽供TCR识别的过程中,必然涉及HLA和抗原肽的结合,特定的HLA可凭借所需要的共用基序(consensusmotif)选择性地结合抗原肽。相关技术中,一般采用湿实验的方法来确定能引发T细胞免疫反应的抗原肽,然而,这样的研究方式将耗费大量的时间和人力物力。
因此,如何快速、低成本的确定抗原肽与含有特定HLA的T细胞免疫呈递和应答的程度,是目前需要解决的问题。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种抗原肽呈递预测模型的构建方法、抗原肽预测方法及装置,能够通过预测模型快速预测抗原肽被HLA呈递的结果,降低研发成本,提高预测效率。
本申请第一方面提供一种抗原肽呈递预测模型的构建方法,包括:
获取预选种类的目标HLA及与所述目标HLA对应的具有预设比例的正样本数据和负样本数据,其中,所述正样本数据包括正样本多肽序列、正样本多肽序列的上游序列、正样本多肽序列的下游序列、及正样本多肽序列与目标HLA的正呈递结果;所述负样本数据包括与所述正样本多肽序列不同的负样本多肽序列、负样本多肽序列的上游序列、负样本多肽序列的下游序列、及负样本多肽序列与所述目标HLA的负呈递结果;
将所述目标HLA及相应的所述正样本数据和负样本数据分别输入多种基于BERT模型的不同架构的子模型进行训练,获得多个训练好的所述子模型;
通过预设规则对各所述训练好的子模型进行筛选,获得包括优选子模型的预测模型;其中,所述预测模型综合所述优选子模型的预测呈递结果预测目标抗原肽被所述目标HLA呈递的结果。
在一实施方式中,所述获取预选种类的目标HLA及与所述目标HLA对应的具有预设比例的正样本数据和负样本数据,包括:
针对目标HLA,将正样本数据与负样本数据按照1:(8~10)生成训练数据,及将正样本数据与负样本数据按照1:(800~1000)生成测试数据。
在一实施方式中,将所述训练数据按照K折交叉验证划分获得训练集和验证集;和/或将所述训练数据按照K折交叉验证划分获得训练集和验证集,并将预设数量的所述伪标签数据加入所述训练集;其中,所述伪标签数据由空白标签的所述测试数据根据预先训练的子模型预测获得对应的伪标签后形成。
在一实施方式中,所述将所述目标HLA及相应的所述正样本数据和负样本数据分别输入多种基于BERT模型的不同架构的子模型进行训练,获得多个训练好的所述子模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶泰科技有限公司,未经北京晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210170086.7/2.html,转载请声明来源钻瓜专利网。