[发明专利]鉴别DNA基因序列中编码区域与非编码区域的系统在审
申请号: | 201410628891.5 | 申请日: | 2014-11-10 |
公开(公告)号: | CN104408331A | 公开(公告)日: | 2015-03-11 |
发明(设计)人: | 滑伟 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 沈志海 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鉴别 dna 基因 序列 编码 区域 系统 | ||
1.一种鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,包括数据处理模块、显示模块、输入输出模块和存储模块;
存储模块:存放DNA序列的片段的数据文件,并存放数据处理模块得到的结果文件;
显示模块:对数据处理模块的过程及结果进行显示;
输入输出模块:用于对数据处理模块进行数据输入或输出;
数据处理模块:读取存储模块内的DNA序列的片段的数据文件,得到一个完整DNA序列,计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比,进行编码区域与非编码区域的鉴别,具体为:
计算一个DNA序列的DRT谱,DRT的谱为
P(k)=|X(k)2,k=1,2,......,N,X(k)为DRT的Ramanujan系数;
通过其在k=3处与其他地方的谱值的比较来判别这个序列究竟是外显子还是内含子:DRT谱在k=3处的值高于其它地方的值,则为外显子;否则,为内含子。
2.如权利要求1所述的鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,数据处理模块通过在k=3处的信噪比来判断鉴别外显子与内含子,长度为N的DNA序列在k=3处的信噪比为其中,ABN为平均背景噪声,其定义为
3.如权利要求2所述的鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,数据处理模块从存储模块中读取一个完整DNA序列的具体步骤为:
数据处理模块读取存储模块中DNA序列的片段的数据文件,获取文件长度并存储,设当前位置为0;
初始化RFT算法的各项参数;所待测序列的长度LengthOfTestSeq初始化为0,将一维数组TheFinalResult清零,大小为DRTWIDTH,将三维数组AllTheXqArray清零,大小为4*DRTWIDTH*DRTWIDTH;
从当前位置读取数据文件;
如读取的数据为‘A’,则设LayerIndex为0;
如读取的数据为‘T’,则设LayerIndex为1;
如读取的数据为‘C’,则设LayerIndex为2;
如读取的数据为‘G’,则设LayerIndex为3;
对数组AllTheXqArray[LayerIndex]的每一列递增取模,递增值为1,取该列在数组中的位置为模,并在相应的位置加1;将LengthOfTestSeq加1,
循环上述读取步骤,直至数据文件读取完全,得到一个完整DNA序列。
4.如权利要求1-3任一项所述的鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,数据处理模块计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比TheSNROfRFT,具体为:
将数组TheFinalResult清零,对所有的i,i=1,2,3,计算MidResult[i][j][k]*TheCqArray[j][k],其中,k=0,…,j,j=0,1,…,DRTWIDTH-1;
将三维数组MidResult中的具有相同第一、二维的元素分别相加,得到新的二维数组MidResult2,大小为4*DRTWIDTH;
对所有的i,i=1,2,3,计算MidResult3[i][j]为(MidResult2[i][j]/LengthOfTestSeq*ThePhiFunPara[j])的平方,其中j=0,…,DRTWIDTH-1;MidResult3为一个二维数组,大小为4*DRTWIDTH;
将最终结果数组的值相加;对所有的j,j=0,1,…,DRTWIDTH-1,计算TheFinalResult[j]=MidResult[0][j]+MidResult[1][j]+MidResult[2][j]+MidResult[3][j];
DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比TheSNROfRFT为TheFinalResult[2]除以TheFinalResult数组中除去第一个元素的所有元素的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410628891.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用