[发明专利]基因文件的上下文感知增量算法在审
申请号: | 201880054764.5 | 申请日: | 2018-08-09 |
公开(公告)号: | CN111095421A | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | A·马哈拉纳;M·C·康斯坦丁内斯库 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G06F16/2458 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 李永敏;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 文件 上下文 感知 增量 算法 | ||
1.一种用于压缩多个基因组数据文件的至少一个增量文件的方法,该方法包括:
接收多个基因组数据文件作为输入;
通过遍历所接收到的多个基因组数据文件来确定多个行;
比较与所遍历的多个基因组数据文件相关联的多个行;
基于所比较的多行生成多个所得的增量文件;以及
通过利用通用文件压缩器来压缩所生成的多个所得的增量文件。
2.如权利要求1所述的方法,还包括:
将所压缩的多个所得的增量文件存储到用户设备上;以及
向用户呈现所压缩的多个所得的增量文件。
3.如权利要求1所述的方法,其中,接收多个基因组数据文件作为输入,还包括:
接收至少一个源文件;以及
接收至少一个目标文件。
4.如权利要求3所述的方法,还包括:
确定所接收到的多个基因组数据文件未排序;以及
利用排序工具对所接收到的多个基因组数据文件中的多个行中的每一个进行排序。
5.如权利要求1所述的方法,还包括:
确定所接收到的多个基因组数据文件为兼容格式。
6.如权利要求1所述的方法,其中,通过遍历所接收的多个基因组数据文件来确定多个行,还包括:
读取与所接收到的多个基因组数据文件相关联的多行中的每一行;以及
确定所接收到的多个基因组数据文件是同步的。
7.如权利要求1所述的方法,其中比较与所遍历的多个基因组数据文件相关联的多个行,还包括:
比较与所比较的多个行相关联的多个特定列;
确定所比较的多个特定列与所遍历的多个基因组数据文件的所比较的多个行的匹配;
比较多个行中的每一行的多个附加列;
基于所遍历的多个基因组数据文件的多行中的每一行的所比较的多个附加列,生成多个所得的增量文件;以及
读取与所遍历的多个基因组数据文件相关联的多个行中的下一行。
8.如权利要求1所述的方法,其中比较与所遍历的多个基因组数据文件相关联的多个行,还包括:
比较与所比较的多个行相关联的多个特定列;
确定所比较的多个确定的列和所遍历的多个基因组数据文件的所比较的多个行的不匹配;以及
读取与所遍历的多个基因组数据文件相关联的多个行中的下一行。
9.一种系统,包括适于执行根据任何前述方法权利要求的方法的所有步骤的装置。
10.一种计算机程序,包括指令,当在计算机系统上执行所述计算机程序时,所述指令用于执行根据任何前述方法权利要求的方法的所有步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880054764.5/1.html,转载请声明来源钻瓜专利网。