[发明专利]基于公共子序列的基因芯片表达数据的OPSM挖掘方法有效

专利信息
申请号: 201410323563.4 申请日: 2014-07-08
公开(公告)号: CN104156635B 公开(公告)日: 2017-07-07
发明(设计)人: 廖政玲;赵洪雅;赵晓荣;周旋;李美航;朱晓晴;罗洁;罗桂银;吴笛;薛云;蔡倩华;胡晓晖;李铁臣 申请(专利权)人: 华南师范大学;深圳职业技术学院
主分类号: G06F19/20 分类号: G06F19/20
代理公司: 广州粤高专利商标代理有限公司44102 代理人: 江裕强,何淑珍
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了基于公共子序列的基因芯片表达数据的OPSM挖掘方法,其包括(1)输入基因芯片数据,对数据进行预处理;(2)获得基因芯片数据中任意两行之间的公共子序列;(3)生成长度为2的候选集树;(4)在长度为2的候选集树上进行剪枝操作得到2‑频繁树;(5)将2‑频繁树拼接成3‑候选集树,并经过剪枝操作得到3‑频繁树;(6)将k‑频繁树上进行拼接成k+1‑候选集树,并经过剪枝操作得到k+1‑频繁树,直到不能产生频繁树为止,最终得到所有列模式长度且满足行阈值的OPSM。该方法在前缀树存储和遍历的操作上减少了时间和空间复杂度;可以在不需要大幅增加运算时间的情况下,精确找到基因芯片数据上所有满足支持度阈值的OPSM。
搜索关键词: 基于 公共 序列 基因芯片 表达 数据 opsm 挖掘 方法
【主权项】:
基于公共子序列的基因芯片表达数据的OPSM挖掘方法,其特征在于包括如下步骤:(1)输入基因芯片数据,对数据进行预处理;具体是:首先输入基因芯片数据,对数据进行预处理,即把一个原始数据矩阵A的每一行都做升序排序,它们的数值大小用它们的列标号代替,得到列置换矩阵;在数据预处理阶段,将每一个基因在每个芯片试验中的表达量按照从小到大的顺序排列,而且用相应的芯片试验编号来代替,即对于原始矩阵中的每一行,把所有的值按升序排列,用对应的列标号替代原来的值,使原始矩阵转化为一个序列数据集;(2)获得基因芯片数据中任意两行之间的公共子序列;对所述列置换矩阵,应用改进的CalACS方法得到任意两行之间的公共子序列,具体是:对于序列长度分别为|A|,|B|的序列A和B,CalACS的时间和空间复杂度均为O(|A|×|B|),令A和B序列的长度相同,即|A|=|B|,以变量NA[i]来存储以A序列中第i个元素Ai结尾的A,B两个序列的公共子序列集合;A,B的公共子序列中任意两个元素必须在A序列和B序列中保持着一样的前后次序关系,假设在A序列中Aj的位置是在Ai之前,若元素Aj在B序列中仍然排在元素Ai之前,则表示Ai和Aj在B中仍然保持着与A中一致的先后位置关系,因此以Aj结尾的公共子序列集合中必然包含原来以Aj结尾的公共子序列集合中的每一项再拼接上Ai后得到的全部新序列集合,在此基础上构造出全部NA[i],而A和B的所有公共子序列集合就是所有NA[i]的并集;(3)生成长度为2的候选集树;(4)在长度为2的候选集树上进行剪枝操作即把不满足频繁条件的枝条删除,得到2‐频繁树;(5)将2‐频繁树拼接成3‐候选集树,并经过剪枝操作得到3‐频繁树;具体是:按照Apriori原则将步骤(2)中得到的长度为3的公共子序列拼接在步骤(4)中得到2‐频繁树上,从而建立3‐候选集树,再进行与步骤(4)中一样的剪枝操作得到3‐频繁树;(6)依次重复上述操作,将k‐频繁树上进行拼接成k+1‐候选集树,并经过剪枝操作得到k+1‐频繁树,直到不能产生频繁树为止,其中k的取值范围为2到原始基因芯片数据矩阵的列数减1,最终得到所有列模式长度且满足行阈值的OPSM。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;深圳职业技术学院,未经华南师范大学;深圳职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410323563.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top