[发明专利]基于多标记学习的抗菌肽活性预测方法在审

专利信息
申请号: 201410712399.6 申请日: 2014-11-28
公开(公告)号: CN104484580A 公开(公告)日: 2015-04-01
发明(设计)人: 周丰丰;王普;肖绚;葛瑞泉;刘记奎 申请(专利权)人: 深圳先进技术研究院
主分类号: G06F19/10 分类号: G06F19/10
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 吴平
地址: 518055 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 标记 学习 抗菌 活性 预测 方法
【说明书】:

技术领域

发明涉及生物医学工程,特别是涉及一种能够快速、准确、自动标注抗菌肽活性的基于多标记学习的抗菌肽活性预测方法。

背景技术

抗菌肽是一种参与固有免疫的小分子多肽,一般由20~60个氨基酸残基组成,这类活性多肽对细菌具有广谱高效杀菌活性。随着人们研究的深入,发现这些抗细菌肽对部分真菌、原虫、病毒及癌细胞等均具有强有力的杀伤作用。抗菌肽的广泛的生物学活性显示了其在医学上良好的应用前景。

通过实验手段测定抗菌肽的活性,无论是基于体内或体外的技术,不仅非常费时,费用也较昂贵。目前,研究者们已经提出了十多种抗菌肽预测器,然而这些工具基本都是用于判断肽分子是否具有抗菌性,或者说是否属于抗菌肽家族,没有进一步对抗菌肽的具体活性做出预测。大多数都是设计二分类模型用来判断肽分子是否属于抗菌肽;或提出的方法能够实现对抗菌肽的活性预测,但是只限于5种活性,预测精度也有待进一步提高。现有的方法大多数都是二分类模型,只能用于抗菌肽识别。

发明内容

基于此,有必要针对提供一种能够快速、准确、自动标注抗菌肽活性的基于多标记学习的抗菌肽活性预测方法。

一种基于多标记学习的抗菌肽活性预测方法,包括以下步骤:

提取肽序列对应的氨基酸成分,并根据所述氨基酸成分获取对应的矩特征向量x,其中,所述矩特征向量x用于描述肽序列各个角度的形状特点;

采用多标记学习算法并根据公式W=(XTX)-1XTY计算最小化变换矩阵W,其中,设x的类标签向量为y=[y1,y2,…,yc]T;最小化变换矩阵W的公式为min||XW-Y||;c为种类标签数,X表示训练样本矩阵,Y表示训练样本对应的类标记矩阵,每个行向量对应一个样本;则对于待测样本x’,其对各标记的输出为f(x,y)=xW;

根据各标记输出f(x,y)=xW获取预测类标签向量集合h(x)={y|f(x,y)≥0,y∈{1,2,…,c}}。

在其中一个实施例中,所述提取肽序列对应的氨基酸成分和矩特征向量x的步骤包括:

根据氨基酸的物理化学属性指标对氨基酸序列作数字编码;

将氨基酸序列的每个氨基酸残基意义对应转换成数值序列;

根据所述数值序列对肽序列的整体、N端和C端计算矩特征向量x,其中,N端指肽序列的钱5个氨基酸,C端指肽序列的后5个氨基酸。

在其中一个实施例中,所述矩特征向量x包括1阶原点矩、2阶中心矩、3阶中心矩和4阶中心矩。

在其中一个实施例中,所述类标签向量为y=[y1,y2,…,yc]T中yi=1表示样本x具有类标签i;yi=-1表示样本x不具有类标签i。

在其中一个实施例中,判断XTX是否可逆,若否,则用XTX的广义逆替代。

在其中一个实施例中,还包括采用遗传算法对所述矩特征向量x进行优化。

在其中一个实施例中,所述采用遗传算法对所述矩特征向量x进行优化的步骤包括:

选取种群规模;

对染色体编码;

选取适应度函数fitness=海明损失+排序损失+1/10000*特征数目;

采用精英选择,其中,所述精英选择为上一代种群中最好的2个个体直接带入下一代;

选取杂交比例0.8;

当适应度函数值基本不变时,终止进化,选取此时对应的矩特征向量集合。

在其中一个实施例中,所述种群进化到150代数,所述适应度函数数值基本不变。

在其中一个实施例中,,采用海明损失、子集准确率、排序损失、覆盖范围、一位错误及平均查准率对所述基于多标记学习的抗菌肽活性预测方法进行评测。

在其中一个实施例中,采用十折交叉验证评测所述基于多标记学习的抗菌肽活性预测方法,并将计算结果取20次交叉验证的均值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410712399.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top