[发明专利]一种卷积神经网络预测蛋白质溶解性的方法有效

专利信息
申请号: 201910824184.6 申请日: 2019-09-02
公开(公告)号: CN110534160B 公开(公告)日: 2022-09-30
发明(设计)人: 王鲜芳;杜志勇;郜鹏;刘依锋;李鸿飞;陆凡 申请(专利权)人: 河南师范大学
主分类号: G16B40/00 分类号: G16B40/00;G06N3/04;G06N3/08
代理公司: 北京专赢专利代理有限公司 11797 代理人: 刘梅
地址: 453004 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 卷积 神经网络 预测 蛋白质 溶解性 方法
【权利要求书】:

1.一种卷积神经网络预测蛋白质溶解性的方法,其特征在于,其包括以下步骤:

S1:对蛋白质数据进行筛选,排除包含有非人体必须的20种氨基酸的蛋白质序列;

S2:使用CD-hit工具降低数据集冗余度;

S3:计算每个蛋白质序列的2-mer频率;

S4:将数据集分割为训练集Dtr、测试集Dte和校准集Dcor;

S5:对每个子训练集进行卷积神经网络子模型训练,得到n个子模型;

S6:每个子模型对校准集Dcor进行预测运算,获得二级模型训练集Dsoc;

S7:使用训练集Dsoc对二级分类器模型进行训练;

S8:保存各个卷积神经网络子模型和二级模型;S9:使预测数据通过步骤S1和S2两步处理,获得2-mer频率特征;S10:使用得到的2-mer频率特征作为各个卷积神经网络子模型的输入,获得各个子模型的预测数据;S11:对各个子模型的预测数据建立二级分类器输入数据,进行二级分类器模型的预测;S12:返回二级分类器模型预测结果,算法结束。

2.根据权利要求1所述的卷积神经网络预测蛋白质溶解性的方法,其特征在于,所述步骤S3具体分割方式为:数据集以2:1的比例划分测试集Dtra和训练集Dte;在对训练集Dte划分子训练集和校准集,设置子训练集个数N,同时对训练集进行随机化处理,将数据集平均划分为N+1份;其中N份为子训练集、一份为校准集Dcor。

3.根据权利要求1所述的卷积神经网络预测蛋白质溶解性的方法,其特征在于,所述步骤S3的具体操作方法为:首先建立20*20矩阵A,其次计算蛋白质序列的2-mer,最后矩阵A与蛋白质序列长度相除得到2-mer频率。

4.根据权利要求1所述的卷积神经网络预测蛋白质溶解性的方法,其特征在于,所述步骤S4中还对训练集Dtr再次分割为若干个子训练集{Dtr1,Dtr2…Dtrn},其中(Dtr1+Dtr2+…+Dtrn=Dtr)。

5.根据权利要求1所述的卷积神经网络预测蛋白质溶解性的方法,其特征在于,所述S5步骤中卷积神经网络子模型具体设计为:

S5.1:输入蛋白质2-mer频率X∈R20*20,其中20是氨基酸符号字典的长度;

S5.2:多卷积池,卷积块由一组三元组{(fk,qk,ak)}k=1……K表示,fk为卷积滤波器大小,qk为卷积块k中的卷积滤波器的数量,ak为与该卷积块相关联的激活函数,使用的ak为ReLU函数,对输入数据进行1*1维度卷积操作; 卷积操作使用以下数学等式表示:

其中C为在训练阶段期间学习权重;S5.3:经过对卷积成获得特征进入深度神经网络(DNN)计算,其中每个神经元的数学表达式为:

Oi=Sigmoid(Wi*x+bi)i=1……d

其中d为神经网络层数,第一层为输入层、最后一层为输出层;bi为第i层的偏移量;Wi为第i层的权重矩阵,Oi为第i层的输出;

在DNN中上一层的输出为下一层的输入。

6.根据权利要求1所述的卷积神经网络预测蛋白质溶解性的方法,其特征在于,所述步骤S10将2-mer频率数组导入各个卷积神经网络子模型在预测前进行打分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学,未经河南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910824184.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top