[发明专利]一种基于机器学习技术预测细菌外膜蛋白质的方法在审

专利信息
申请号: 201711435147.3 申请日: 2017-12-26
公开(公告)号: CN108009405A 公开(公告)日: 2018-05-08
发明(设计)人: 陈抗 申请(专利权)人: 重庆佰诺吉生物科技有限公司
主分类号: G06F19/24 分类号: G06F19/24;G06F19/18;G06F19/28;G06K9/62
代理公司: 重庆图为知识产权代理事务所(普通合伙) 50233 代理人: 蒋国荣
地址: 400000 重庆市九龙坡*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 技术 预测 细菌 膜蛋白 方法
【说明书】:

发明公开了一种使用机器学习技术来在细菌基因组上预测其编码的外膜蛋白质的方法,该方法为:利用PSI‑BLAST算法,计算蛋白质的位置特异性特征向量,采用自相关函数来进行特征转换,建立基于支持向量机的分类器,对外膜蛋白质和非外膜蛋白质进行分类,通过本地计算机程序,接受用户输入的蛋白质序列,预测其是否为一个外膜蛋白。本发明可对细菌全基因组编码的蛋白质序列进行计算预测,敏感度高,计算速度快,为细菌基因组内外膜蛋白质的快速鉴定和筛选提供了有效工具。本发明是一种准确有效的外膜蛋白筛选方法,可广泛应用于新测序细菌基因组的外膜蛋白质的鉴定。

技术领域

本发明属于预测细菌外膜蛋白质的技术领域,尤其涉及一种基于机器学习技术预测细菌外膜蛋白质的方法。

背景技术

革兰阴性细菌外膜上分布大量beta-barrel形状的跨膜蛋白质,其中的一些蛋白质是细菌入侵细胞的作用蛋白,也是宿主免疫系统清除细菌的靶向识别蛋白,介导多种疾病的产生,同时也激活机体的免疫机制对抗细菌的感染。

当前,在新的细菌基因组内鉴定外膜蛋白主要通过实验完成。然而,使用实验方法对外膜蛋白进行鉴定,需要耗费大量的人力物力,成本高,效率低。一个新的细菌基因组往往编码几千个蛋白质,使用传统实验方法对其中的外膜蛋白质进行一一鉴定,是一件极其困难的事情。因此,使用计算机来进行生物信息学预测,可自动化实现,速度快,成本低,是解决在细菌全基因组内鉴别外膜蛋白质的有效途径。因此,建立一种准确快速的生物信息学预测和识别算法,成为当前这一领域需要解决的主要问题。

发明内容

本发明的目的在于提供一种基于机器学习技术预测其外膜蛋白质的方法,旨在解决目前在新的细菌基因组内鉴定外膜蛋白主要通过实验完成的问题。

本发明是这样实现的,一种基于机器学习技术预测细菌外膜蛋白质的方法,该可在细菌全基因组水平预测外膜蛋白质的方法为:

利用PSI-BLAST算法,将蛋白质序列与无冗余的蛋白质序列数据库进行比对,计算位置特异性迭代打分矩阵(PSSM),通过组成函数和自相关函数分别计算PSSM的组成特征(氨基酸残基组成/PSSM_AAC),以及PSSM自相关特征(自相关的氨基酸位置特异性组成/PSSM_AC),建立基于支持向量机的分类器,对外膜蛋白质和非外膜蛋白质进行分类,通过本地计算机程序,接受用户输入的蛋白质序列,预测用户输入的蛋白质序列是否为一个外膜蛋白。

一种基于机器学习技术预测细菌外膜蛋白质的方法,该可在细菌全基因组水平预测外膜蛋白质的方法为:

进一步,该基于机器学习技术预测外膜蛋白质的方法具体包括以下步骤:

步骤一、用户将待预测的蛋白质序列,采用FASTA格式,输入本地计算机程序;

步骤二、计算机程序采用PSI-BLAST程序,将蛋白质序列与无冗余的蛋白质序列进行比对;

步骤三、计算机程序调用Matlab来运行核心预测程序,计算蛋白质序列的氨基酸位置特异性组成和自相关的氨基酸位置特异性组成等特征;

步骤四、Matlab程序将多类特征依据预设方式进行特征选择和组合,产生一个蛋白质特征向量;

步骤五、Matlab程序调用libSVM程序,使用事先训练好的模型,预测蛋白质是外膜蛋白的似然率;

步骤六、根据SVM预测结果判断其是否为一个外膜蛋白,将结果输出到屏幕,或者保存到本地计算机硬盘;

进一步,所述PSSM矩阵的计算方法为:

使用PSI-BALST算法,设定e值为0.001,迭代次数3次,将蛋白质序列与NCBI无冗余的蛋白质数据库nr进行比对,输出计算过程中获得的PSSM矩阵。

进一步,所述PSSM组成和PSSM自相关特征的计算方法为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆佰诺吉生物科技有限公司,未经重庆佰诺吉生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711435147.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top