[发明专利]基于卷积神经网络的精液蛋白质的预测方法有效
申请号: | 201911073759.1 | 申请日: | 2019-11-06 |
公开(公告)号: | CN110827923B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 黄岚;邵丹;王岩;何凯;杨森;白天 | 申请(专利权)人: | 吉林大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B30/00;G16B15/00 |
代理公司: | 长春市吉利专利事务所(普通合伙) 22206 | 代理人: | 李晓莉 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 精液 蛋白质 预测 方法 | ||
1.基于卷积神经网络的精液蛋白质的预测方法,其特征是:包括以下步骤,并且以下面步骤顺次进行,
步骤一、将精液中已经被生物实验验证的蛋白质作为模型训练的正样本并存储正样本的蛋白质信息数据;
步骤二、在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过5个的蛋白质家族,从这些蛋白质家族中随机选取5个蛋白质信息作为模型训练的负样本并存储负样本的蛋白质信息数据;
步骤三、将正样本和负样本信息数据均按照80%训练集、20%测试集进行分割;
步骤四、将蛋白质特征进行分类,初步获得蛋白质特征向量;
步骤五、用Wilcoxon秩和检验(rank sum test)方法过滤步骤四中初步获得的蛋白质特征向量,过滤后的蛋白质特征向量用支持向量机联合特征去除算法(SVM-RFE)进行特征选择,获得模型拟合训练用的蛋白质特征向量;
步骤六、通过卷积神经网络建立分类器模型,所述分类器模型的输入为步骤五中获得的特征向量,分类器模型的输出为是入精液蛋白质或非入精液蛋白质,所述卷积神经网络的结构为一层卷积、一层池化、一层全连接层、最后为一层输出层,卷积神经网络的卷积核使用一维卷积,池化使用的最大池化,全连接层包含100个神经元,输出层包含1个神经元;
步骤七、对步骤六中的卷积神经网络采用自适应矩估计(Adam)优化器对二分类交叉熵(binary cross entropy)进行优化,并得出训练成功的卷积神经网络;
步骤八、对分类器模型进行评估
将验证集中正样本和负样本的蛋白质信息以及步骤五中获得的特征向量输入步骤七训练后的分类器模型进行验证,输出的验证结果使用敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthewscorrelation coefficient)及ROC曲线下面的面积AUC(Area Under Roc Curve),作为评价模型验证效果的评估指标,
获得的AUC小于90%,重复步骤七重新拟合训练分类器模型直至AUC达到90%以上;
步骤九、用测试集对步骤八中验证后的分类器模型进行分类准确性验证,分类准确性小于90%,重复步骤七和步骤八直至分类准确性达到90%以上,分类器模型建立完成;
步骤十、将预测的蛋白质进行步骤四和步骤五,获得预测蛋白质的特征向量,向步骤九中建立完成的分类器模型中输入预测蛋白质的特征向量,通过输出的预测结果实现基于卷积神经网络的精液蛋白质的预测
2.根据权利要求1所述的基于卷积神经网络的精液蛋白质的预测方法,其特征是:所述步骤四中蛋白质特征按照4个大类进行分类,分别为:1)序列性质,2)结构性质,3)域和基序性质,4)物理化学性质。
3.根据权利要求1所述的基于卷积神经网络的精液蛋白质的预测方法,其特征是:所述步骤五中支持向量机联合特征去除算法(SVM-RFE)的选择判断函数DJ(i)定义如下:
其中,yi是样本xi的标签,yj是样本xj的标签,K(xi,xj)是测试xi和xj相似度的核函数,α是通过SVM训练后得到的值,T代表矩阵的转置,H代表矩阵。
4.根据权利要求1所述的基于卷积神经网络的精液蛋白质的预测方法,其特征是:所述步骤六中的卷积运算定义如下:
其中zi,k代表第k个特征图(feature map)中的第i个神经元的输出,bk代表第k个特征图的偏差项,fl代表一维卷积核的长度,fn′代表上一层特征图的数量,xi′,k′代表上一层第k′个特征图的第i′个神经元,wu,k′,k代表第k个特征图的一个神经元与上一层第k′个特征图的第u个神经元的权重连接,s代表步长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911073759.1/1.html,转载请声明来源钻瓜专利网。