[发明专利]基于变步长最小均方误差自适应滤波器的基因识别系统有效
申请号: | 201710110410.5 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106919808B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 郭睿;徐勇;张健 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 步长 最小 误差 自适应 滤波器 基因 识别 系统 | ||
本发明公开了一种基于变步长最小均方误差自适应滤波器的基因识别系统,包括变步长最小均方误差自适应滤波器算法改进单元和基因结构多特征加权融合算法处理单元;所述的变步长最小均方误差自适应滤波器算法改进单元,用于通过变步长最小均方误差自适应改进算法对基因序列进行滤波处理,得到随机噪声较少、周期3行为较强的基因特征;所述的基因结构多特征加权融合算法处理单元,用于通过多特征加权融合策略,对基因序列进行特征提取,从而得到表达能力更强的特征向量。本发明提出了变步长最小均方误差自适应滤波器改进算法和多特征加权融合算法,并将二者集成到同一个基因识别系统中,进一步改善其识别性能。
技术领域
本发明涉及生物信息学中对测序获得的DNA序列进行可编码基因区域的识别和定位领域,具体涉及一种基于变步长最小均方误差(最小均方误差)自适应滤波器的基因识别系统。
背景技术
现阶段基因识别的研究取得了很多优秀的成果,形成了许多成熟的预测系统,但这些系统主要都依托于一些经典的机器学习标记方法,如HMM和CRF等,一般模型结构复杂,调节参数繁多,训练耗时且不易存储,同时系统特异性过强,不利于物种间的迁移通用。另外,针对短基因序列随机噪声大、特征信息稀少而识别率低等问题,也不能进行有效的抑制和解决。
为了克服上述种种问题,国内外研究者们在数字信号处理技术、基因序列长程相关性以及统计特征等方面都做了大量的研究和分析,取得了不错的研究成果。
发明内容
本发明的目的在于提供一种基于变步长最小均方误差(LMS)自适应滤波器的基因识别系统,提出了变步长最小均方误差自适应滤波器改进算法和多特征加权融合算法,并将二者集成到同一个基因识别系统中,进一步改善其识别性能。
为实现上述目的,本发明采取的技术方案为;
一种基于变步长最小均方误差自适应滤波器的基因识别系统,包括变步长最小均方误差自适应滤波器算法改进单元和基因结构多特征加权融合算法处理单元;所述的变步长最小均方误差自适应滤波器算法改进单元,用于通过变步长最小均方误差自适应改进算法对基因序列进行滤波处理,得到随机噪声较少、周期3行为较强的基因特征;所述的基因结构多特征加权融合算法处理单元,用于通过多特征加权融合策略,对基因序列进行特征提取,从而得到表达能力更强的特征向量。
研究表明,外显子编码区域对应的功率谱曲线在其π/3处通常可以观测到明显的波峰,而非编码区序列对应的功率谱曲线则观测不到如此波峰。假设系统输出为Y(n),分别定义其一阶、二阶变量为
E1(n)=Y(n)-Y(n-1)
E2(n)=E1(n)-E1(n-1)
因为输出Y(n)中的波峰部分通常表示算法预测的外显子区域,对算法识别性能而言至关重要,所以着重改善算法对波峰曲线上升部分的预测十分必要。在波峰曲线处于上升阶段时,可以适当减小步长因子,以提高算法识别的准确性;而在其他部分,可以适当增大步长因子,以促使系统快速收敛并具备更强的实时追踪能力。依据函数微分的几何定义,曲线从波谷上升到波峰的阶段其斜率必有E1(n)>0,而其曲线斜率的变化趋势可能通常要经历一个由小变大再变小的过程。在曲线斜率增长变快时,希望调整步长相应越小,而曲线斜率增长变慢,则调整步长相应逐渐增大。为了满足这一要求,提出系统输出反馈与步长因子新的函数关联关系,公式定义如下
其中,u0为初始步长,k为常数,且有1≤k<1/u0λmax,λmax为输入信号自相关矩阵最大的特征值。
另外,一般最小均方误差自适应滤波器基因识别算法研究中,通常定义A、C、G、T四种碱基对应的滤波器输出信号的平方和为Y(n),有
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710110410.5/2.html,转载请声明来源钻瓜专利网。