[发明专利]对象排序方法、装置及系统有效

专利信息
申请号: 201511021334.8 申请日: 2015-12-30
公开(公告)号: CN106933855B 公开(公告)日: 2020-06-23
发明(设计)人: 陈友林;肖强 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/953 分类号: G06F16/953
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 李辉
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对象 排序 方法 装置 系统
【说明书】:

本申请提供了一种对象排序方法、装置及系统,所述方法包括:确定待处理对象的待处理数据信息;在排序方式为按数据值降序排列情况下,仅在所述待处理数据值大于当前阈值的情况下,才将所述待处理数据信息发送至与所述排序节点;在排序方式为按数据值升序排列情况下,仅在所述待处理数据值小于当前阈值的情况下,才将所述待处理数据信息发送至所述排序节点;其中,所述当前阈值为所述排序节点已有排序结果中末位数据信息中的数据值,所述已有排序结果为所述排序节点对多个数据信息按所述排序方式排序后生成的。本申请可以占用较少时间和较小内存,从而提高海量数据的排序效率并降低网络吞吐量。

技术领域

本申请涉及计算机技术领域,尤其涉及一种对象排序方法、装置及系统。

背景技术

随着科学技术的快速发展,各行各业中开始普及计算机技术。伴随着各行各业的日常运作,这些计算机可以产生蕴含丰富数据信息的海量数据,并且这些数据信息具有较高的应用价值。为了提取海量数据中的有价值数据信息,可以对海量数据进行数据分析。

目前,对海量数据进行数据分析,可以采用数据排序方式、建模分析方式、数据统计方式等技术手段。其中,对海量数据中的对象进行排序为获取海量数据中有价值数据信息的一个常用技术手段。例如,对淘宝网上卖家的订单量进行排序,对互联网上新闻的点击量进行排序,对全国各个城市的PM2.5污染指数进行排序等等。

在对海量数据中的对象进行排序的过程中,如果海量数据中的对象是固定不变的,则排序结果也是固定不变的。在这种情况下,可以对海量数据中的对象采用简单的排序算法进行排序即可。但是,伴随着各行各业的计算机中日常运行,使得海量数据是不断变化的。即海量数据中需要排序的对象总量是变化的,或者,每个对象的数据值是变化的。在海量数据不断变化的情况下,为了保证排序结果的准确性,便需要对海量数据进行实时排序。

目前,对海量数据进行实时排序技术方案,一般为实时对海量数据中需要排序的每个对象进行排名,然后才可以得到最终排序结果。但是,海量数据中的对象总量巨大,对每个对象进行排名会导致每次排序均占用较长时间和较大内存,进而导致数据排序过程的效率较低且增加了网络吞吐量。

因此,现在需要一种对象排序方法,可以占用较少时间和较小内存,从而提高海量数据的排序效率并降低网络吞吐量。

发明内容

本申请发明人在研究过程中发现:

可以基于对象排序系统来对海量数据中的对象进行排序。参见图1,对象排序系统包括:多个分发节点110、多个计算节点120、多个一级排序节点130和二级排序节点140。下面介绍图1所示的对象排序系统的执行过程。

由于海量数据的对象总量巨大,一个计算节点的计算能力不足以计算所有对象的数据值。为了计算所有对象的数据值,分发节点110可以将海量数据中的所有对象分发至不同的计算节点120,以便每个计算节点120计算一部分对象的数据值。

由于海量数据的对象总量巨大,一个排序节点的排序能力不足以对所有对象进行排序,所以可以利用两级排序节点来进行排序。一级排序节点用于对部分对象进行排序,然后仅仅将排序结果输出至二级排序节点,由二级排序节点再对各个一级排序节点的排序结果进行整合,从而实现输出指定数量排序结果的目的。

例如,以排序结果为输出前10名(即计算TOP(10))为例,假设对象总量为50个,一级排序节点为2个,二级排序节点为1个。一个一级排序节点可以对25个对象进行排序,输出25个对象的前10名(TOP(10));另一个一级排序节点可以对另外25个对象进行排序,输出另外25个对象的前10名(TOP(10))。两个一级排序节点可以将计算得到的部分对象的排序结果输出至二级排序节点,由二级排序节点对两个部分对象的排序结果进行整合,从而得到最终排序结果,即整体50个对象的前10名。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201511021334.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top