[发明专利]数据文件的调度方法、装置及设备在审
申请号: | 202010121311.9 | 申请日: | 2020-02-26 |
公开(公告)号: | CN113312329A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 叶胜程 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/185 | 分类号: | G06F16/185;G06F16/17;G06F16/182 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据文件 调度 方法 装置 设备 | ||
1.一种数据文件的调度方法,其特征在于,所述方法包括:
根据数据文件的活跃度信息获取所述数据文件的热度信息;
根据多个数据文件的热度信息从所述多个数据文件中确定目标数据文件;
将至少一部分目标数据文件调度到对应的工作空间。
2.根据权利要求1所述的方法,其特征在于,
所述根据数据文件的活跃度信息获取所述数据文件的热度信息,包括:
根据数据文件的历史使用数据确定所述数据文件的活跃度信息;其中,所述活跃度信息包括所述数据文件在统计周期的使用数量;
根据所述统计周期的使用数量和所述统计周期的权重系数,获取所述数据文件的热度信息;其中,所述统计周期的权重系数为预先配置的。
3.根据权利要求1所述的方法,其特征在于,所述根据多个数据文件的热度信息从所述多个数据文件中确定目标数据文件,包括:
根据多个数据文件的热度信息,将所述多个数据文件划分到N个簇,所述簇中包括至少一个数据文件,N为大于或者等于1的正整数;
根据N个簇的热度信息从所述N个簇中选取目标簇;
将所述目标簇中的数据文件确定为目标数据文件。
4.根据权利要求3所述的方法,其特征在于,所述根据多个数据文件的热度信息,将所述多个数据文件划分到N个簇,包括:基于K均值聚类算法,根据多个数据文件的热度信息,将所述多个数据文件划分到N个簇。
5.根据权利要求3所述的方法,其特征在于,
所述根据N个簇的热度信息从所述N个簇中选取目标簇,包括:
针对N个簇中的各簇,根据所述簇中的数据文件的热度信息,确定所述簇的热度信息,所述簇的热度信息包括所述簇的热度值;
根据N个簇的热度值的大小关系,对所述N个簇进行排序;
基于排序结果,从所述N个簇中选取热度值大的P个簇作为目标簇;
其中,P大于或者等于1,P小于或者等于N。
6.根据权利要求1所述的方法,其特征在于,
所述将至少一部分目标数据文件调度到对应的工作空间,包括:
根据目标数据文件的活跃度信息确定所述目标数据文件的预调度数量M;
将M个目标数据文件调度到工作空间的M个工作节点。
7.根据权利要求6所述的方法,其特征在于,所述根据目标数据文件的活跃度信息确定所述目标数据文件的预调度数量M,包括:
根据目标数据文件的活跃度信息确定所述目标数据文件的平均使用次数;
根据所述平均使用次数和变量值确定所述变量值的泊松分布概率;
根据多个变量值的泊松分布概率和概率阈值,从所述多个变量值中确定目标变量值,并将所述目标变量值确定为所述目标数据文件的预调度数量M。
8.根据权利要求6所述的方法,其特征在于,
所述将M个目标数据文件调度到工作空间的M个工作节点,包括:
根据所述目标数据文件的资源使用情况和工作空间的各工作节点的资源剩余情况,从所述工作空间的各工作节点中选取M个工作节点;
将所述M个目标数据文件调度到选取的所述M个工作节点。
9.根据权利要求8所述的方法,其特征在于,
所述根据所述目标数据文件的资源使用情况和工作空间的各工作节点的资源剩余情况,从所述工作空间的各工作节点中选取M个工作节点,包括:
基于粒子群优化算法,根据所述目标数据文件的资源使用情况和工作空间的各工作节点的资源剩余情况,从工作空间的各工作节点中选取M个工作节点。
10.根据权利要求1-9任一项所述的方法,其特征在于,
所述工作空间具体包括万维网-集成开发环境WEB-IDE的工作空间;
所述数据文件具体包括代码文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010121311.9/1.html,转载请声明来源钻瓜专利网。