[发明专利]一种大数据场景下的数据分割方法在审
申请号: | 202210132296.7 | 申请日: | 2022-02-14 |
公开(公告)号: | CN114491157A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 贺广福;薛源海;陈翠婷;俞晓明;刘悦;沈华伟;程学旗 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/90 | 分类号: | G06F16/90;G06F16/901;G06F16/903 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 场景 分割 方法 | ||
1.一种大数据场景下的数据分割方法,其特征在于,包括:
获取探测区间,确定待分割的数据集合中属于探测区间内的区内数据条数;
在区内数据条数不处于预定的容忍范围内时,对探测区间的右端点进行一次或者多次指数型调整直至得到使得区内数据条数处于容忍范围内的右端点或者越过容忍范围;
在指数型调整导致区内数据条数越过容忍范围时,以当前的探测区间的右端点以及前一个探测区间的右端点构成的区间为查找范围,通过二分查找法确定使得区内数据条数处于容忍范围内的右端点;
根据探测区间的左端点以及使得区内数据条数处于容忍范围内的右端点确定的分割区间对数据集合进行分割。
2.根据权利要求1所述的方法,其特征在于,对探测区间的右端点进行指数型调整包括利用以下公式计算右端点:
right=left+l*2c;
其中,right表示探测区间的右端点,left表示探测区间的左端点,l表示探测区间的起始长度,c表示指数,c为整数。
3.根据权利要求2所述的方法,其特征在于,对探测区间的右端点进行一次或者多次指数型调整包括:
在探测区间内的区内数据条数小于容忍范围的下界时,每次将指数c加1后重新确定区内数据条数;和/或
在探测区间内的区内数据条数大于容忍范围的上界时,每次将指数c减1后重新确定区内数据条数。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在对数据集合进行下一次分割前,根据上次的分割区间的长度以及右端点,确定下一次分割对应的探测区间,
其中,下一次分割对应的探测区间的左端点为前次的分割区间的右端点加1,下一次分割对应的探测区间的右端点等于前次的分割区间的右端点加1再加前次的分割区间的长度。
5.根据权利要求1所述的方法,其特征在于,所述探测区间限定的范围为数据的时间属性,数据集合中任意数据对应的时间戳中记录的时间处于所述探测区间则表示该数据是属于探测区间内的区内数据。
6.一种数据在线迁移的方法,其特征在于,该方法包括:
根据处理器的各线程的处理能力以及容忍的偏差,得到容忍范围;
利用权利要求1-5之一所述的大数据场景下的数据分割方法对待分割的数据集合进行分割,得到一个或者多个数据块,其中,每个数据块中包含的数据条数处于容忍范围内;
对数据块中的有效数据进行迁移并移除过时的数据。
7.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被处理器执行以实现权利要求1至6中任一项所述方法的步骤。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;以及
存储器,其中存储器用于存储可执行指令;
所述一个或多个处理器被配置为经由执行所述可执行指令以实现权利要求1至6中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210132296.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:GOA电路及显示面板
- 下一篇:一种用户自定义后台任务创建方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置