[发明专利]一种与核糖核酸结合的蛋白质的预测方法有效
申请号: | 201610877010.2 | 申请日: | 2016-10-08 |
公开(公告)号: | CN106529207B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 刘士勇;张晓利 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种与核糖核酸结合的蛋白质(RBP)的预测方法。首先根据氨基酸的特性,获取样本蛋白的候选特征总集;然后以候选特征之间的相关度和/或冗余度为标准,从候选特征总集中选取个最佳特征作为特征向量;根据样本蛋白的特征向量以及蛋白质特征,建立预测模型;最后根据待预测蛋白的特征向量,获得待预测蛋白的蛋白质特性的预测结果。本发明的候选特征总集涵盖了氨基酸的多种特性,全面考虑了影响蛋白质结合核糖核酸性能的多方面因素,准确度经验证超过90%,将现有技术的准确度提高了35%,马修相关系数为0.788,将现有技术提高了2倍,从而预测更为全面准确。 | ||
搜索关键词: | 一种 核糖核酸 结合 蛋白质 预测 方法 | ||
【主权项】:
1.一种与核糖核酸结合的蛋白质的预测方法,其特征在于,包括以下步骤:S1.根据氨基酸的疏水性,获取第一候选特征的集合;根据氨基酸的极性,获得第二候选特征的集合;根据氨基酸的规范化的范德瓦尔斯体积,获取第三候选特征的集合;根据氨基酸的极化性,获取第四候选特征的集合;根据蛋白质的二级结构,获取第五候选特征的集合;根据氨基酸的溶剂可及性,获取第六候选特征的集合;根据氨基酸的带电性和极性,获取第七候选特征的集合;根据氨基酸的位置特异性打分矩阵,获取第八候选特征的集合;根据第一候选特征的集合至第八候选特征的集合的并集,获得样本蛋白的候选特征总集Vi={vi,k};其中,vi,k表示第i个样本蛋白的第k个候选特征,i为1~ξ的任意整数,k为1~N1的任意整数,ξ为样本蛋白的总数量,N1为候选特征总集中候选特征的总数量,ξ≥5N1;S2.根据候选特征之间的相关度和/或冗余度,在所述第i个样本蛋白的候选特征总集中选取个候选特征作为第i个样本蛋白的最佳特征,其分别为并获得第i个样本蛋白的特征向量其中,S3.根据样本蛋白的特征向量以及蛋白质特性,建立预测模型f(xi),并获取样品蛋白在所述预测模型中的评估指标σ,如果σ≥阈值η,进入S4,否则返回步骤S2;S4.获取待预测蛋白与样本蛋白对应的特征向量x,代入所述步骤S3中所建立的预测模型,获得待预测蛋白的蛋白质特性的预测结果f(x),从而判断该待预测蛋白是属于核糖核酸结合蛋白,还是属于非核糖核酸结合蛋白。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610877010.2/,转载请声明来源钻瓜专利网。