[发明专利]基于机器学习技术预测细菌保护性抗原蛋白的方法及系统有效
申请号: | 201910264168.6 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110060738B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 陈薇;宰晓东;徐俊杰;殷瑛;张军;李汭桦 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 北京市众天律师事务所 11478 | 代理人: | 李新军 |
地址: | 100850*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于机器学习技术预测细菌保护性抗原蛋白的方法,所述方法包括:(1)数据收集:收集已知细菌保护性抗原和非保护性抗原分别作为学习模型的阳性集和阴性集,并分析抗原序列的特征因素;(2)模型建立:采用投票算法将支持向量机算法、神经网络算法、贝叶斯分类算法和决策树算法集成,建立保护性抗原预测的机器学习模型;(3)保护性抗原预测:对细菌待预测蛋白序列进行特征值分析并利用建立好的模型预测其是否为保护性抗原,排除与人、鼠同源性蛋白,输出预测到的细菌保护性抗原。本发明可对细菌全基因组编码的蛋白进行保护性抗原预测,提高了预测准确度,能够缩短细菌疫苗研发的进程,适用于广泛应用。 | ||
搜索关键词: | 基于 机器 学习 技术 预测 细菌 保护性 抗原 蛋白 方法 系统 | ||
【主权项】:
1.一种基于机器学习技术预测细菌保护性抗原蛋白的方法,所述方法包括以下步骤:(1)数据收集:收集已知细菌保护性抗原作为机器学习模型的阳性数据集,收集已知非保护性抗原作为机器学习模型的阴性数据集,并基于与保护性抗原密切相关的特征因素,对数据集中抗原的蛋白序列特征进行分析,构建保护性抗原和非保护性抗原特征注释数据集,用于后续机器学习模型的构建,所述特征因素包括:亚细胞定位、功能域相似性、抗原性、表位密度、毒力基因概率、粘附概率;(2)建立模型:针对抗原特征注释数据集,将数据集分为训练集和测试集两部分,使用机器学习算法,对数据集进行训练后建立模型,再采用投票算法对所述机器学习算法建立的模型集成以建立保护性抗原预测的机器学习模型,所述机器学习算法包括支持向量机算法SVM、神经网络算法、贝叶斯分类算法和决策树算法;(3)保护性抗原预测:输入待预测细菌全基因组蛋白序列后,使用计算机程序分析获得相应的特征因素值,并利用建立好的机器学习模型进行保护性抗原的预测,判断该蛋白是否为保护性抗原蛋白,并排除人、鼠蛋白同源性,输出预测到的细菌保护性抗原。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910264168.6/,转载请声明来源钻瓜专利网。