[发明专利]一种海量外排序方法在审
申请号: | 202110009351.9 | 申请日: | 2021-01-06 |
公开(公告)号: | CN112631787A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 薛昌熵 | 申请(专利权)人: | 薛昌熵 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 726412 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海量 外排 方法 | ||
1.一种外排序方法,其特征包括:采样,具体包括根据采样得到数据分布,由此划分均匀键值;粗排,具体包括根据均匀键值分桶,扫描待排序数据分发至对应的桶并落盘;精排,具体包括对各个桶文件内排序,组成最终排序后数据。
2.根据权利要求1,其特征在于:对待排序数据多次随机采样。对样本排序,得到样本数据分布。桶大小为略小于可用内存,对样本键值分桶,得到分桶键值,使得桶的上下限键值所界定的数据记录总体积略小于可用内存。若键值重复过多,可单独成桶。
3.根据权利要求1,其特征包括:扫描待排序数据,根据每条记录的键值界定所属的桶,分发到各自桶中,并将桶落盘。
4.根据权利要求1,其特征包括:对粗排后的每一个桶文件,调入内存中内排序,完毕后形成已排序数据。可以全部或者选取某一部分排序,可落盘全部或者部分文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于薛昌熵,未经薛昌熵许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110009351.9/1.html,转载请声明来源钻瓜专利网。