[发明专利]包含三维自由能的外源性miRNA调控靶基因预测方法有效
申请号: | 201711380586.9 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108090327B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘元宁;王林宇;徐瑞;张浩;赵奇;段云娜;刘海明 | 申请(专利权)人: | 吉林大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/30;G16B40/00;G16B25/10 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 陈宏伟 |
地址: | 130011 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种包含三维自由能的外源性miRNA调控的靶基因预测方法,改进传统序列匹配特征,新提出了种子区域的三维能量统计特征及结合位点的空配惩罚函数统计特征,种子区域结合位点特征表示了结合位点的具体配对信息,使得构建的特征输入向量更为精确,而且更加贴合实际,因此提高了miRNA靶点预测的准确度。 | ||
搜索关键词: | 包含 三维 自由能 外源性 mirna 调控 基因 预测 方法 | ||
【主权项】:
1.一种包含三维自由能的外源性miRNA调控靶基因预测方法,包括以下步骤:1)通过上位机的输入单元输入外源性miRNA序列和靶基因序列,并通过以太网接口传至miRNA调控的靶基因预测装置的内存储单元,并进一步将数据读到缓存单元中;2)序列预处理单元从缓存单元中读出miRNA序列、靶基因序列,对输入的序列格式进行判断:数据中miRNA或靶基因序列中含非ATUGC的字母,则立即发出一个高优先级的错误信号通过缓存单元传到内存储单元,再通过以太网接口传回到上位机的显示单元上输出错误信息;通过了序列格式判断后,以miRNA的长度构建滑动窗口;3)序列比对单元利用上述构建的滑动窗口以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合:当序列间的高度相似区域以相同顺序或方向出现时,需要使用全局比对算法,两个序列的比对基于一个比对矩阵计算的,行列数分别由两条序列长度决定,计算方法基于一个置换矩阵和一个空位惩罚函数,将得到两条序列的最优匹配;计算公式如下:Mi,j = max{Mi,j-1 – Pgap , Mi-1,j - Pgap , Mi-1,j-1 + W(si ,tj )} ;式中, 为置换矩阵;Mi,j-1 ,Mi-1,j-1 为原矩阵;W(si ,tj )为权重; 为空位惩罚函数;si 为 组成的第一条序列S中元素;tj 是 组成的第二条序列T中元素;利用置换矩阵搜索两个序列中具有高度相似性的区域,找到序列间较短共同区域扩展匹配区域作为候选靶点集合;4)特征提取单元对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵,作为神经网络训练单元的输入;5)神经网络训练单元对所有候选靶点结果进行训练,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将结果暂存于内存储单元;6)通过最优匹配靶点筛选单元,利用初始设定的参数及部分特征和三维自由能阈值对上述候选靶点集合进行筛选,不满足条件的靶点将会被筛选掉;将筛选后满足条件的靶点集合存于外存储单元;筛选公式: 式中;Target为符合要求的靶点;Sequence为候选靶点集合;E(seq, µ(Ψ))为候选靶点集匹配域三维自由能计算公式;seq为候选靶点集合中的候选靶点;Ψ为初始参数及部分特征;Ê为三维自由能阈值;7)将上述外存储单元中的存储结果以太网接口传回上位机的显示单元输出显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711380586.9/,转载请声明来源钻瓜专利网。