[发明专利]用于生物信息数据的紧凑表示的方法和设备在审
申请号: | 201680090052.X | 申请日: | 2016-10-11 |
公开(公告)号: | CN110168649A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 乔吉奥·索亚;丹尼尔·伦齐 | 申请(专利权)人: | 耶诺姆希斯股份公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 瑞士*** | 国省代码: | 瑞士;CH |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于压缩由基因组测序仪产生的基因组序列数据的方法和设备。将核苷酸序列与一个或多个参考序列进行比对,根据匹配准确度对核苷酸序列进行分类,以及对于所述数据被分区的每个层使用不同的源模型和熵编码器将核苷酸序列编码为多个语法元素层。 | ||
搜索关键词: | 方法和设备 核苷酸序列 核苷酸序列编码 基因组序列数据 基因组测序仪 生物信息数据 匹配准确度 参考序列 语法元素 熵编码器 源模型 比对 紧凑 分区 压缩 分类 | ||
【主权项】:
1.一种用于压缩由测序仪产生的基因组序列数据的方法,所述基因组序列数据包括核苷酸序列的读段,其特征在于,所述方法包括下列步骤:将所述读段与一个或多个参考序列进行比对,从而创建比对读段,根据与所述一个或多个参考序列的匹配准确度来对所述比对读段进行分类,从而创建比对读段的类别;将被分类和比对的读段编码为多个语法元素层,其中将分类的比对读段编码为多个语法元素层包括根据所述比对读段的类别选择所述语法元素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于耶诺姆希斯股份公司,未经耶诺姆希斯股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680090052.X/,转载请声明来源钻瓜专利网。
- 上一篇:序列变异识别的验证方法和系统
- 下一篇:用于编码和解码数据结构的质量值的方法