[发明专利]注释数据库索引结构、快速注释遗传变异的方法及系统有效
申请号: | 201910031889.2 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109712674B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 李俊;黄丹丹;王思发 | 申请(专利权)人: | 深圳市泰尔迪恩生物信息科技有限公司 |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G06F16/13;G06F16/188 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 向霞 |
地址: | 518000 广东省深圳市龙华区龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基因组功能注释数据库的索引结构、快速注释遗传变异的方法及系统。所述索引结构包括基于注释数据库的一级索引文件、基于一级索引文件的二级索引文件。一级索引文件包括多个文件块,每个文件块由头部和主体组成,主体由多行压缩数据组成,每个文件块对应注释数据库的一个压缩块。二级索引文件由多行数据组成,每行数据存储一级索引文件中一个文件块主体数据的位置区间以及能直接寻址该文件块的64位虚拟文件地址。注释方法通过扫描两级索引文件来找到结果所在数据行的文件地址,再根据文件地址定位注释数据库提取注释信息对遗传变异进行注释,比直接扫描注释数据库极大地减少了磁盘读操作,提升查询速度。 | ||
搜索关键词: | 注释 数据库 索引 结构 快速 遗传 变异 方法 系统 | ||
【主权项】:
1.一种基因组功能注释数据库索引结构,其特征在于,所述索引结构包括基于注释数据库的一级索引文件、基于一级索引文件的二级索引文件;所述一级索引文件由多个文件块组成,每个文件块由头部和主体组成,主体由多行压缩数据组成,每个文件块对应注释数据库里的一个压缩块;所述二级索引文件由多行数据组成,每行数据存储一级索引文件中一个文件块主体数据的位置区间以及能直接寻址该文件块第一条数据的64位虚拟文件地址。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市泰尔迪恩生物信息科技有限公司,未经深圳市泰尔迪恩生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910031889.2/,转载请声明来源钻瓜专利网。