[发明专利]一种FASTQ文件压缩中的碱基序列编码方法和系统在审
申请号: | 202011016128.9 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112102883A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 陈毓新;赵子健;李胜康;龚淳;黄志博;张勇;方林 | 申请(专利权)人: | 深圳华大生命科学研究院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于生物信息数据处理技术领域,涉及一种FASTQ文件压缩中的碱基序列编码方法和系统,S1对待编码碱基序列的简并碱基信息进行编码;S2判断待编码碱基序列是否存在接头序列,若存在所述接头序列则对所述接头序列进行编码;S3将待编码碱基序列与参考序列进行比对,若所述待编码碱基序列与参考序列比对成功,则将所述待编码碱基序列的比对信息进行编码;S4若所述待编码碱基序列与参考序列比对失败,则对所述待编码碱基序列进行熵编码。其通过尽量降低接头序列、简并碱基、低质量碱基给序列比对和熵编码带来的负面影响,从而提高了比对率和熵编码的压缩率。 | ||
搜索关键词: | 一种 fastq 文件 压缩 中的 碱基 序列 编码 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011016128.9/,转载请声明来源钻瓜专利网。