[发明专利]一种对集群中执行设备评价的方法和设备有效
申请号: | 201710198341.8 | 申请日: | 2017-03-29 |
公开(公告)号: | CN107451039B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王家忙 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健;邵栋 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 执行 设备 评价 方法 | ||
1.一种在分布式作业主设备端对集群中执行设备评价的方法,其中,所述方法包括:
获取所述执行设备的运行状态;
确定所述运行状态对应的评价系数,并基于所述评价系数统计所述执行设备的评价结果;
基于错误作业的概率生成错误评判系数,并利用所述错误评判系数,定期对所述评价结果进行调整;
将所述执行设备的评价结果上传至调度主设备,以供所述调度主设备生成所述执行设备的性能评价信息。
2.根据权利要求1所述的方法,其中,获取所述执行设备的运行状态包括:
基于所述执行设备对分布式作业实际运行的情况,获取所述执行设备的运行状态。
3.根据权利要求2所述的方法,其中,确定所述运行状态对应的评价系数,并基于所述评价系数统计所述执行设备的评价结果包括:
当所述分布式作业在执行设备上实际运行情况出现至少以下任一种:
所述分布式作业的单个作业实例执行失败;
所述分布式作业的所有作业实例执行失败;
所述分布式作业的作业实例无法启动;
分布式作业的所述作业实例的执行时间超出预设时间;
则判断所述执行设备出现异常的运行状态,并基于所述异常的运行状态确定对应的评价系数,并将所述评价系数累加获得所述执行设备的评价结果。
4.根据权利要求3所述的方法,其中,确定所述运行状态对应的评价系数,并基于所述评价系数统计所述执行设备的评价结果包括:
根据所述异常的运行状态对分布式作业实际运行的影响,确定对应的评价系数。
5.根据权利要求4所述的方法,其中,所述异常的运行状态对分布式作业实际运行的影响越大,所确定的评价系数越大。
6.根据权利要求1至5中任一项所述的方法,其中,所述方法还包括:
在所述执行设备进行设备维修或更新后,初始化所述执行设备的评价结果。
7.一种在调度主设备端对集群中执行设备评价的方法,其中,所述方法包括:
接收分布式作业主设备上传的执行设备的评价结果,其中,所述执行设备的评价结果是基于所述执行设备的运行状态所对应的评价系数统计获得的,并基于错误作业的概率生成错误评判系数,利用所述错误评判系数,定期对所述评价结果进行调整;
基于所述执行设备的评价结果,生成所述执行设备的性能评价信息。
8.根据权利要求7所述的方法,其中,基于所述执行设备的评价结果,生成所述执行设备的性能评价信息包括:
基于所述执行设备的评价结果,确定所述执行设备排序信息;
基于所述排序信息,生成所述执行设备的性能评价信息。
9.一种对集群中执行设备评价的分布式作业主设备,其中,所述分布式作业主设备包括:
获取装置,用于获取所述执行设备的运行状态,还包括调整单元,所述调整单元用于基于错误作业的概率生成错误评判系数,并利用所述错误评判系数,定期对评价结果进行调整;
统计装置,用于确定所述运行状态对应的评价系数,并基于所述评价系数统计所述执行设备的评价结果;
上传装置,用于将所述执行设备的评价结果上传至调度主设备,以供所述调度主设备生成所述执行设备的性能评价信息。
10.根据权利要求9所述的分布式作业主设备,其中,所述获取装置包括:
获取单元,用于基于所述执行设备对分布式作业实际运行的情况,获取所述执行设备的运行状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198341.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种区块链共识方法及装置
- 下一篇:一种线上压力模拟测试的方法和设备