[发明专利]鉴别DNA基因序列中编码区域与非编码区域的系统在审

专利信息
申请号: 201410628891.5 申请日: 2014-11-10
公开(公告)号: CN104408331A 公开(公告)日: 2015-03-11
发明(设计)人: 滑伟 申请(专利权)人: 南京工程学院
主分类号: G06F19/18 分类号: G06F19/18
代理公司: 南京正联知识产权代理有限公司 32243 代理人: 沈志海
地址: 211167 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 鉴别 dna 基因 序列 编码 区域 系统
【说明书】:

技术领域

发明涉及一种鉴别DNA基因序列中编码区域与非编码区域的系统。

背景技术

随着科学技术的进步,现代的生物学技术得到蓬勃发展。越来越多的数学方法和信号处理技术被应用于研究生命科学领域,形成了生物信息学这一前沿学科。

现在大多使用离散傅里叶变换(DFT)来作为鉴别DNA基因序列中编码区域与非编码区域的方法,该方法由于采用浮点运算,而计算机的计算精度是有限的,所以存在着计算误差,并且浮点运算耗费很多的计算时间。

首先,现代计算机是用有限位存储实数的,这会导致舍入误差。对于离散傅里叶变换(DFT)而言,基函数是以浮点数的形式近似地存储在计算机中的,由此,经过DFT运算累积的误差会影响到最终的计算结果,有可能与真实值有很大的差异。举例来说,在理论上,1.28965×2.36417=3.0489518405,如果我们对计算保留5位精度,则通过舍入误差而得的结果为3.04895,乘积后面的值(18405)就被舍掉了,就造成了计算误差。

其次,现代的计算机中关于浮点运算相比于整数运算而言是非常耗时的。计算机需要更多的时钟周期完成浮点运算,即使对现代化的专用数字信号处理器(DSP)也是如此。所有的DFT运算都是浮点运算,浮点运算耗费很多的计算时间。

发明内容

本发明的目的是提供一种鉴别DNA基因序列中编码区域与非编码区域的系统,是一种快速而有效的算法,对比于傅里叶变换,该方法的计算量更小,精度更高,解决现有技术中存在的上述问题。

本发明的技术解决方案是:

一种鉴别DNA基因序列中编码区域与非编码区域的系统,包括数据处理模块、显示模块、输入输出模块和存储模块;

存储模块:存放DNA序列的片段的数据文件,并存放数据处理模块得到的结果文件;

显示模块:对数据处理模块的过程及结果进行显示;

输入输出模块:用于对数据处理模块进行数据输入或输出;

数据处理模块:读取存储模块内的DNA序列的片段的数据文件,得到一个完整DNA序列,计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比,进行编码区域与非编码区域的鉴别,具体为:

计算一个DNA序列的DRT谱,DRT的谱为

P(k)=|X(k)|2,k=1,2,......,N,X(k)为DRT的Ramanujan系数;

通过其在k=3处与其他地方的谱值的比较来判别这个序列究竟是外显子还是内含子:DRT谱在k=3处的值高于其它地方的值,则为外显子;否则,为内含子。

进一步地,数据处理模块通过在k=3处的信噪比来判断鉴别外显子与内含子,长度为N的DNA序列在k=3处的信噪比为其中,ABN为平均背景噪声,其定义为

进一步地,数据处理模块从存储模块中读取一个完整DNA序列的具体步骤为:

数据处理模块读取存储模块中DNA序列的片段的数据文件,获取文件长度并存储到FileSize,设当前位置为0;

初始化RFT算法的各项参数;所待测序列的长度LengthOfTestSeq初始化为0,将一维数组TheFinalResult清零,大小为DRTWIDTH,将三维数组AllTheXqArray清零,大小为4*DRTWIDTH*DRTWIDTH;

从当前位置读取数据文件;

如读取的数据为‘A’,则设LayerIndex为0;

如读取的数据为‘T’,则设LayerIndex为1;

如读取的数据为‘C’,则设LayerIndex为2;

如读取的数据为‘G’,则设LayerIndex为3;

对数组AllTheXqArray[LayerIndex]的每一列递增取模,递增值为1,取该列在数组中的位置为模,并在相应的位置加1;将LengthOfTestSeq加1,

循环上述读取步骤,直至数据文件读取完全,得到一个完整DNA序列。

进一步地,数据处理模块计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比TheSNROfRFT,具体为:

将数组TheFinalResult清零,对所有的i,i=1,2,3,计算MidResult[i][j][k]*TheCqArray[j][k],其中,k=0,…,j,j=0,1,…,DRTWIDTH-1;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410628891.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top