[发明专利]基于机器学习技术预测细菌保护性抗原蛋白的方法及系统有效
申请号: | 201910264168.6 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110060738B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 陈薇;宰晓东;徐俊杰;殷瑛;张军;李汭桦 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 北京市众天律师事务所 11478 | 代理人: | 李新军 |
地址: | 100850*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 技术 预测 细菌 保护性 抗原 蛋白 方法 系统 | ||
本发明公开了一种基于机器学习技术预测细菌保护性抗原蛋白的方法,所述方法包括:(1)数据收集:收集已知细菌保护性抗原和非保护性抗原分别作为学习模型的阳性集和阴性集,并分析抗原序列的特征因素;(2)模型建立:采用投票算法将支持向量机算法、神经网络算法、贝叶斯分类算法和决策树算法集成,建立保护性抗原预测的机器学习模型;(3)保护性抗原预测:对细菌待预测蛋白序列进行特征值分析并利用建立好的模型预测其是否为保护性抗原,排除与人、鼠同源性蛋白,输出预测到的细菌保护性抗原。本发明可对细菌全基因组编码的蛋白进行保护性抗原预测,提高了预测准确度,能够缩短细菌疫苗研发的进程,适用于广泛应用。
技术领域
本发明公开了一种基于机器学习技术的细菌保护性抗原预测方法,属于细菌疫苗抗原筛选领域。
背景技术
随着组学以及生物信息学的发展,通过计算机分析进行抗原预测进而筛选符合保护性抗原性质的蛋白作为疫苗候选抗原的反向疫苗学(Reverse Vaccinology)技术逐渐成为研制新型疫苗的重要方法(Heinson A I,International Health,2015,7(2):85.)。该方法已经越来越广泛地应用到各种传染性病原体的疫苗研制中,显示出较好的应用价值。反向疫苗学方法中,保护性抗原的预测与筛选是关键(Delany I,2013,3(5):a012476.)。随着人工智能(Artificial Intelligence,AI)的迅速发展,机器学习(Machine Learning,ML)逐渐应用在了越来越多研究领域。通过算法,机器具备了从已有大量数据中提取特征,不断学习,发现隐含规律的能力,并对世界中发生的事做出判断和预测(Jordan M I,Science,2015,349(6245):255-260.)。在保护性抗原预测领域,机器学习方法已经得到了初步应用。Darren等人建立的VaxiJen方法,获取氨基酸疏水性、分子质量和极性作为抗原特征性质,采用了偏最小二乘法(DA-PLS)算法建立模型,对保护性抗原进行了预测(Flower D R,BmcBioinformatics,2007,8(1):4.)。Bowman和Heinson等人也在此基础上,利用多个常规蛋白理化性质分析软件获取抗原特征性质,并分别采用了支持向量机(Support VectorMachine,SVM)、偏最小二乘判别分析(DA-PLS)和线性回归算法建立模型,取得一定的预测结果(Bowman B N,Vaccine,2011,29(45):8156-8164.;Heinson A,InternationalJournal of Molecular Sciences,2017,18(2):312.)。
然而,目前国内外现有细菌保护性抗原预测方法表现出的预测性能还受到较多局限,导致预测准确度不高,候选抗原范围过广,后续需要进行实验验证大量保护性抗原,给研究者的实际应用带来困难(Dalsass M,Front.Immunol,2019,10:113.)。导致这些困难的主要原因在于,现有的保护性抗原预测方法所应用的抗原特征主要是蛋白的各项理化基础性质,而没有将直接影响保护性抗原的各个关键因素作为特征值,导致数据中包含大量无关的特征属性,会降低机器学习预测模型的准确度,对预测新的保护性抗原造成干扰(OngE,Frontiers in Immunology,2017,8:1382.)。此外,现有保护性抗原预测方法中,均采用单一机器学习算法,具有算法自身的局限性,从而导致机器学习模型预测准确度偏低,尚不能较好达到准确预测细菌保护性抗原的目的(Bowman B N,Vaccine,2011,29(45):8156-8164.;Heinson A,,International Journal of Molecular Sciences,2017,18(2):312.)。因此,建立一种以多个与保护性抗原密切相关因素为特征值并采用集成算法的基于机器学习的细菌保护性抗原预测方法成为当前该领域需要解决的重要问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910264168.6/2.html,转载请声明来源钻瓜专利网。