[发明专利]数据处理方法及装置在审
申请号: | 202011031362.9 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112148491A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 杨泽森 | 申请(专利权)人: | 京东数字科技控股股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06F9/54 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本申请实施例提供一种数据处理方法及装置,该方法包括:获取待处理任务的数量,以及各所述待处理任务之间的链路依赖关系;获取每个待处理任务的权重值;根据所述待处理任务的数量、所述链路依赖关系、以及所述每个待处理任务的权重值,确定每个待处理任务的重要等级。本申请实施例的方案,通过待处理任务的数量、权重值和链路依赖关系来确定待处理任务的重要等级,提高了待处理任务重要等级标识的准确性。
技术领域
本申请实施例涉及大数据技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着大数据时代的到来,企业中每天需要计算海量的大数据,用于支撑企业营销和运营。
由于大数据的任务数量规模巨大,通常在万级、十万级甚至百万级。由于计算任务庞大,因此需要对计算任务进行重要度标识,以便优先处理较为重要的计算任务。目前的重要度标识主要是通过人工主观设置,对整体的大数据平台而言作业的重要程度不够准确。
发明内容
本发明实施例提供一种数据处理方法及装置,以解决通过人工主观设置待处理任务的重要等级,标识不够准确的问题。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取待处理任务的数量,以及各所述待处理任务之间的链路依赖关系;
获取每个待处理任务的权重值;
根据所述待处理任务的数量、所述链路依赖关系、以及所述每个待处理任务的权重值,确定每个待处理任务的重要等级。
在一种可能的实施方式中,根据所述待处理任务的数量、所述链路依赖关系、以及所述每个待处理任务的权重值,确定每个待处理任务的重要等级,包括:
获取每个待处理任务的初始网页排名PR值;
根据所述链路依赖关系,确定每个待处理任务的出链任务,所述待处理任务的出链任务为需要获取所述待处理任务的处理结果进行处理的任务;
根据所述初始PR值、所述待处理任务的数量、所述每个待处理任务的出链任务、以及所述权重值,确定每个待处理任务的重要等级。
在一种可能的实施方式中,根据所述初始PR值、所述待处理任务的数量、所述每个待处理任务的出链任务、以及所述权重值,确定每个待处理任务的重要等级,包括:
根据所述初始PR值、所述待处理任务的数量、所述每个待处理任务的出链任务、以及所述权重值,确定每个待处理任务的稳定PR值;
根据每个待处理任务的稳定PR值,确定每个待处理任务的重要等级。
在一种可能的实施方式中,根据所述初始PR值、所述待处理任务的数量、所述每个待处理任务的出链任务、以及所述权重值,确定每个待处理任务的稳定PR值,包括:
根据所述初始PR值、所述待处理任务的数量、所述每个待处理任务的出链任务、以及所述权重值进行迭代处理,得到每次迭代后的每个待处理任务的PR值;
在所述迭代处理的次数大于或等于预设次数,或者,两次迭代后得到的每个待处理任务的PR值的差值均小于或等于预设值时,停止所述迭代处理,并将最后一次迭代处理得到的每个待处理任务的PR值确定为每个待处理任务的稳定PR值。
在一种可能的实施方式中,获取每个待处理任务的权重值,包括:
获取每个待处理任务的业务维度信息和平台维度信息;
根据每个待处理任务的业务维度信息和平台维度信息,获取每个待处理任务的权重值。
在一种可能的实施方式中,所述方法还包括:
根据每个待处理任务的稳定PR值,确定各资源队列的重要等级;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股股份有限公司,未经京东数字科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011031362.9/2.html,转载请声明来源钻瓜专利网。