[发明专利]一种高通量DNA测序质量分数无损压缩系统及压缩方法有效

专利信息
申请号: 201410240933.8 申请日: 2014-05-30
公开(公告)号: CN103995988B 公开(公告)日: 2017-02-01
发明(设计)人: 周家锐;华韵之;纪震;朱泽轩;曾启明 申请(专利权)人: 周家锐;华韵之;纪震;朱泽轩;曾启明
主分类号: G06F19/10 分类号: G06F19/10
代理公司: 深圳市君胜知识产权代理事务所(普通合伙)44268 代理人: 王永文
地址: 518060 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通量 dna 质量 分数 无损 压缩 系统 方法
【权利要求书】:

1.一种高通量DNA测序质量分数无损压缩方法,其特征在于,所述方法包括以下步骤: 

A、预先基于文化基因算法构造质量分数压缩码本; 

B、接收输入的原始高通量DNA测序质量分数数据,针对数据中每个原始质量分数序列在质量分数压缩码本中搜索与其最相似的编码矢量; 

C、利用所搜索到的编码矢量对相应的原始质量分数序列进行压缩。 

2.根据权利要求1所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述原始高通量DNA测序质量分数数据为ASCII码编码的FASTQ格式。 

3.根据权利要求2所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述步骤A具体为: 

A1、设定质量分数压缩码本的大小M以及编码矢量长度N,统计待输入的原始高通量DNA测序质量分数数据中的符号种类形成符号集合,并据此设置搜索范围; 

A2、在搜索范围内随机构造M个候选解长度为N的寻优个体,形成进化种群,设定文化基因算法迭代次数为K,初始化迭代计数器k=1; 

A3、在每次迭代时,计算进化种群中每个寻优个体的适应度函数值; 

A4、在计算所有寻优个体的适应度函数值后,使用适应度共享技术计算各寻优个体的共享适应度函数值; 

A5、基于各寻优个体的共享适应度函数值,使用文化基因算法优化进化种群。 

A6、更新迭代计数器k=k+1。若k<K,则返回步骤A3,否则执行步骤A7; 

A7、将最终获得的进化种群中各寻优个体映射为各编码矢量,从而构成质量分数压缩码本。 

4.根据权利要求3所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述步骤A3具体为: 

A31、按照预定映射关系将寻优个体转换为编码矢量 

A32、将编码矢量与原始高通量DNA测序质量分数数据中每个原始质量分数序列进行匹配,计算匹配编码后的数据体积; 

A33、将该数据体积作为当前寻优个体的适应度函数值。 

5.根据权利要求4所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述最相似的编码矢量指编辑距离最小的编码矢量。 

6.根据权利要求5所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述步骤C具体为: 

通过动态规划对原始质量分数序列和其最相似的编码矢量进行差异匹配,实现压缩编码形成压缩数据。 

7.根据权利要求6所述的高通量DNA测序质量分数无损压缩方法,其特征在于,所述方法还包括: 

D、利用所有原始质量分数序列的压缩数据构成数据集合,并将其与质量分数压缩码本作为系统输出结果。 

8.根据权利要求7所述的高通量DNA测序质量分数无损压缩方法,其特征在于,解压缩时,将所述数据集合中的每个压缩数据根据所述质量分数压缩码本中的编码矢量恢复成原始质量分数序列,从而得到原始高通量DNA测序质量分数数据。 

9.一种高通量DNA测序质量分数无损压缩系统,其特征在于,所述系统包括: 

压缩码本设计模块,用于基于文化基因算法构造质量分数压缩码本; 

质量分数压缩模块,用于接收输入的原始高通量DNA测序质量分数数据,针对数据中每个原始质量分数序列在质量分数压缩码本中搜索与其最相似的编码矢量;并利用所搜索到的编码矢量对相应的原始质量分数序列 进行压缩。

10.根据权利要求9所述的高通量DNA测序质量分数无损压缩系统,其特征在于,所述系统还包括: 

质量分数解压模块,用于将所述数据集合中的每个压缩数据根据所述质量分数压缩码本中的编码矢量恢复成原始质量分数序列,从而得到原始高通量DNA测序质量分数数据。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周家锐;华韵之;纪震;朱泽轩;曾启明,未经周家锐;华韵之;纪震;朱泽轩;曾启明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410240933.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top