[发明专利]基于有监督自组织映射神经网络的microRNA预测方法有效
申请号: | 201911284083.0 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111477271B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 於东军;阚雯雯 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 组织 映射 神经网络 microrna 预测 方法 | ||
1.一种基于有监督自组织映射神经网络的microRNA预测方法,其特征在于,包括以下步骤:
步骤1:特征提取,抽取基于microRNA序列的特征,并使用RNAfold程序获取待测microRNA序列的二级结构碱基配对信息,结合基于一级序列的特征和基于二级结构的特征转换为向量化表示,得到最终用于计算预测手段的特征向量;
步骤2:接收输入层的特征数据,隐含层自组织映射学习输入数据的空间分布规律,并进行数据间的映射处理,在此过程中形成新的特征表示;
步骤3:输出监督层使用步骤2中生成的新的特征表示计算输出类别和相关误差,并反向传输误差更新网络权重;
步骤4:使用交叉验证方法,设定阈值,获取分类结果。
2.根据权利要求1所述的基于有监督自组织映射神经网络的microRNA预测方法,其特征在于:所述步骤1中,对于一个序列长度为n的microRNA序列,提取其基于序列的特征,提取microRNA序列长度、GC含量、组成成分和编码位置偏差特征。
3.根据权利要求1所述的基于有监督自组织映射神经网络的microRNA预测方法,其特征在于:所述步骤1中,对于一个microRNA序列,提取其结构相关的特征;使用RNAfold程序提取序列的二级结构碱基配对信息,基于默认温度下的二级结构最小自由能原则,获得microRNA序列中各碱基的配对情况;根据碱基的配对信息,统计计算任意3个相邻核苷酸的位置组成情况,抽取32个三联体结构组成特征;根据二级结构中的碱基对与序列长度比值,抽取特征AU配对与n的比值、GC配对与n的比值和CU配对与n的比值;根据二级结构中的最小自由能,抽取microRNA热力学相关特征。
4.根据权利要求1所述的基于有监督自组织映射神经网络的microRNA预测方法,其特征在于:所述步骤2中,将抽取得到microRNA序列特征向量作为输入,在自组织映射神经网络层学习输入的空间分布规律,与输入节点全互联,自组织映射中的各神经元由一组权重向量表示,通过寻找最佳匹配单元来不断调整最佳匹配单元及其邻近神经元的权向量,在低维输出空间保持拓扑结构信息,得出新特征表示,自组织映射输出节点默认为10×10的网格。
5.根据权利要求1所述的基于有监督自组织映射神经网络的microRNA预测方法,其特征在于:所述步骤3中,输出层的两个神经元和自组织映射层全连接,使用自组织映射层输出的新的特征表示信息,利用层间输入与输出的连接权进行样本标签值计算,并将预测样本标签与其真实标签的误差值反向传输到网络中,使用梯度下降方法更新神经网络的权重,此过程多次迭代。
6.根据权利要求1所述的有监督自组织映射神经网络的microRNA预测方法,其特征在于:所述步骤4中,使用阈值分割的方法判断序列是否属于微小RNA,使得预测结果的马修斯相关系数最大化,获取分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284083.0/1.html,转载请声明来源钻瓜专利网。