[发明专利]包含三维自由能的外源性miRNA调控靶基因预测方法有效
申请号: | 201711380586.9 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108090327B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘元宁;王林宇;徐瑞;张浩;赵奇;段云娜;刘海明 | 申请(专利权)人: | 吉林大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/30;G16B40/00;G16B25/10 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 陈宏伟 |
地址: | 130011 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包含 三维 自由能 外源性 mirna 调控 基因 预测 方法 | ||
1.一种包含三维自由能的外源性miRNA调控靶基因预测方法,包括以下步骤:
1)通过上位机的输入单元输入外源性miRNA序列和靶基因序列,并通过以太网接口传至miRNA调控的靶基因预测装置的内存储单元,并进一步将数据读到缓存单元中;
2)序列预处理单元从缓存单元中读出miRNA序列、靶基因序列,对输入的序列格式进行判断:
数据中miRNA或靶基因序列中含非ATUGC的字母,则立即发出一个高优先级的错误信号通过缓存单元传到内存储单元,再通过以太网接口传回到上位机的显示单元上输出错误信息;通过序列格式判断后,以miRNA的长度构建滑动窗口;
3)序列比对单元利用上述构建的滑动窗口以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合:
当序列间的高度相似区域以相同顺序或方向出现时,需要使用全局比对算法,两个序列的比对基于一个比对矩阵计算的,行列数分别由两条序列长度决定,计算方法基于一个置换矩阵和一个空位惩罚函数,将得到两条序列的最优匹配;
计算公式如下:
Mi,j = max{Mi,j-1– Pgap , Mi-1,j - Pgap , Mi-1,j-1 + W(si,tj)} ;
式中, Mi,j为置换矩阵;
Mi,j-1,Mi-1,j-1为原矩阵;
W(si,tj)为权重;
Pgap为空位惩罚函数;
si为S1S2S3…Sn组成的第一条序列S中元素;
tj是t1t2t3…tm组成的第二条序列T中元素;
利用置换矩阵搜索两个序列中具有高度相似性的区域,找到序列间较短共同区域扩展匹配区域作为候选靶点集合;
4)特征提取单元对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵,作为神经网络训练单元的输入;
5)神经网络训练单元对所有候选靶点结果进行训练,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将结果暂存于内存储单元;
6)通过最优匹配靶点筛选单元,利用初始设定的参数及部分特征和三维自由能阈值对上述候选靶点集合进行筛选,不满足条件的靶点将会被筛选掉;将筛选后满足条件的靶点集合存于外存储单元;
筛选公式:
式中;
Target为符合要求的靶点;
Sequence为候选靶点集合;
E(seq, Ψ)为候选靶点集匹配域三维自由能计算公式,
seq为候选靶点集合中的候选靶点;
Ψ为初始参数及部分特征;
Ê为三维自由能阈值;
7)将上述外存储单元中的存储结果用以太网接口传回上位机的显示单元输出显示。
2.一种基于多特征融合的外源性miRNA调控的靶基因预测的装置,其特征在于:ARM11微处理器(01)由接口部分(011)、存储单元(012)、处理单元(013)组成:
1)接口部分(011)包括:接口部分-USB接口(0111)、接口部分-以太网接口(0112);接口部分-USB接口(0111)与外置存储器连接,将miRNA靶基因预测得到的结果数据的转存,实现存储单元的扩增;接口部分-以太网接口(0112)与上位机(02)的上位机-以太网接口(0203)连接,实现 ARM11微处理器(01)与上位机(02)的互通信;
2)存储单元(012)包括:内存储单元(0121)、缓存单元(0123)及外存储单元(0122);内存储单元(0121)与缓存单元(0123)进行连接,完成 RNA 二级结构识别的初始数据及中间数据的存储;缓存单元(0123)与内存储单元(0121)及序列预处理单元(0131)连接,实现miRNA靶基因预测的初始数据的存储;外存储单元(0122)与候选靶点筛选单元(0135)连接,实现miRNA靶基因预测的结果数据的存储;
3)处理单元(013)包括:序列预处理单元(0131)、序列比对单元(0132)、特征提取单元(0133)、神经网络训练单元(0134)及候选靶点筛选单元(0135);
序列预处理单元(0131)与缓存单元(0123)连接,获取缓存单元(0123)中读取到的输入序列,并对其格式进行判断:
序列比对单元(0132)与序列预处理单元(0131)连接,获取序列预处理数据,以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合;
特征提取单元(0133)与序列比对单元(0132)连接,获取序列比对数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
神经网络训练单元(0134)与特征提取单元(0133)连接,获取特征提取数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
候选靶点筛选单元(0135)与神经网络训练数据,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将排序后的结果存于内存储单元(0121)中;
4)上位机(02)由输入单元(0201),上位机-接口部分(021)的上位机-USB接口(0202)、以上位机-太网接口(0203),显示单元(0204)共同构成来完成与ARM11微处理器(01)的协调工作;其中输入单元(0201)与上位机-接口部分(021)连接,完成 miRNA 序列以及靶基因序列的输入;上位机-接口部分(021)与ARM11微处理器(01)进行连接通信;显示单元(0204)与上位机-接口部分(021)连接,负责完成miRNA靶基因靶点结果的输出显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711380586.9/1.html,转载请声明来源钻瓜专利网。