[发明专利]一种基于卷积神经网络和规划动态算法的RNA二级结构生成器及其预测方法有效
申请号: | 201810851933.X | 申请日: | 2018-07-30 |
公开(公告)号: | CN110021340B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 张浩;张春鹤;刘元宁;魏旭;常浩武;李聪 | 申请(专利权)人: | 吉林大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B30/10 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 姜美洋 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 规划 动态 算法 rna 二级 结构 生成器 及其 预测 方法 | ||
1.一种基于卷积神经网络和规划动态算法的RNA二级结构预测方法,其特征在于,包括:
步骤一、选取已知RNA二级结构的数据作为训练样本,并对训练样本 进行预处理得到训练数据;
其中,所述RNA二级结构通过RNA二级结构生成器获取,所述RNA二级结构生成器包括:
微处理器;
存储单元,其包括:
内存储单元,其用于RNA初始数据的存储;
缓存单元,其连接所述内存储单元;
外存储单元,其与所述微处理器连接,用于完成所述RNA二级结构预测结果数据的存储;
处理单元,其包括:
预处理单元,其用于获取缓存单元中RNA数据,并对所述RNA数据进行预处理;
滑动窗口单元,其连接所述预处理单元,用于将经过预处理后的RNA数据分割为大小相同的核苷酸序列二维数组;
卷积神经网络模型单元,其以RNA测序及其结构数据为基础,构建卷积神经网络模型,对序列内各个碱基进行分类预测;
规划动态算法单元,其用于修正卷积神经网络模型单元的预测结果;
步骤二、将经过预处理后的RNA数据分割为大小相同的RNA二维数组;
步骤三、准备训练样本集,将训练样本集进行分类,构建卷积神经网络模型,提取出数据中有效的隐藏特征,调整模型参数,优化预测精度,直至模型内部参数收敛,得到训练完成的卷积神经网络模型;
步骤四、 对待预测的RNA序列数据进行预处理,并输入训练完成的卷积神经网络模型,对序列内各个碱基进行分类预测;其中,分类预测结果为生成RNA二级结构的概率;
步骤五、将分类预测完成的二级结构预测结果输入规划修正算法模型进行误差修正,进而得到最终的二级结构预测结果;
所述步骤五包括:
规划动态算法单元将读取卷积神经网络模型单元中的l个三元组与未标记的RNA的序列数据,并以此为依据,经过下面公式计算
其中,
N(i,j)表示未知结构RNA序列中第i个碱基到第j个碱基之间形成的结构的最大概率和;Ri为RNA序列上第i个碱基类别,Rj为RNA序列上的第j个碱基类别;
经过多次迭代后生成的N(1,l)所对应的结构为所求的符合RNA二级结构定义且各个碱基匹配概率之和最大的RNA二级结构。
2.根据权利要求1所述的基于卷积神经网络和规划动态算法的RNA二级结构预测方法,其特征在于,所述预处理包括将RNA序列数据进行独热编码。
3.根据权利要求2所述的基于卷积神经网络和规划动态算法的RNA二级结构预测方法,其特征在于,所述步骤二利用滑动窗口的方式,将RNA四元组分割为多个相同的二维数组,并将其对应的结构数据作为对应数组的特征标签。
4.根据权利要求1或3所述的基于卷积神经网络和规划动态算法的RNA二级结构预测方法,其特征在于,所述步骤二包括:将所述二维数组作为输入向量群输入卷积神经网络模型,所述神经网络模型包括两个卷积层、两个池化层,两个全连接层和一个输出层,第一卷积层的卷积核为维度相等的矩阵,其大小为3×1×1,第二卷积层卷积核大小为3×1×8,输出层向量为三种RNA二级结构的生成概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810851933.X/1.html,转载请声明来源钻瓜专利网。