[发明专利]一种容器云平台的健康稳定运行程度的评分系统及方法有效
申请号: | 201910864036.7 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110597701B | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 潘远航;吴文涛;徐俊杰;李海创;颜开;郭峰;陈齐彦 | 申请(专利权)人: | 上海道客网络科技有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;H04L12/26;H04L29/08 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 王函 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 容器 平台 健康 稳定 运行 程度 评分 系统 方法 | ||
本发明公开了一种容器云平台的健康稳定运行程度的评分方法及系统,采用容器云平台集群的节点负载均衡程度评分和节点的健康度汇总评分;容器云平台集群的节点负载均衡程度评分包括:统计每个节点的使用资源量;计算每个节点的负载占比;横坐标为累计节点数占比,纵坐标为负载累计占比,绘出洛伦茨曲线,计算集群基尼系数;计算集群负载均衡分值。节点的健康度汇总评分包括:计算集群中负载度;对可能出现的错误划分等级,并相应扣分;对每节点的每条错误扣分;计算集群节点健康汇总分值。本发明首次将基尼系数理论应用到计算机云平台的负载均衡度计算,提供一个直接直观的呈现方式,体现集群的稳定程度,能够有效提高集群运维效率。
技术领域
本发明属于计算机云平台技术领域,涉及一种容器云平台(适用于公有云/私有云和混合云)的稳定和健康运行程度的监控统计方式,尤其涉及一种容器云平台的健康稳定运行程度的评分系统及方法。
背景技术
容器云平台集群的健康稳定性,首先很大一部分取决于集群中各个节点的负载均衡状况,其次也受到节点的软硬件稳定程度和趋势的影响。容器云平台是指运行容器的公有云/私有云/混合云。一般或称为PaaS/CaaS平台。节点是指云平台中的单个计算机主机实体。集群是指所有节点的集合。负载指的是计算机主机上的工作压力。
一、现有技术1
在基于Kubernetes(业界最流行的容器云调度系统的实现方案)的容器云平台解决方案中,虽然Kubernetes拥有原生的调度器拥有一系列调度方法,例如:
·LeastRequestedPriority:支持具有较少请求资源的节点。换句话说,放置在节点上的Pod越多,并且Pod使用的资源越多,该策略将给出的排名越低。
·BalancedResourceAllocation:支持资源使用均衡的节点。
·ServiceSpreadingPriority:对于给定的服务,此策略旨在确保服务的Pod在不同的节点上运行。
参考资料:https://kubernetes.io/docs/concepts/scheduling/kube-scheduler/#
但是上述方案在集群创建之初,节点之间是对等条件下,基本上能够达到节点负载的均衡和容器的平衡分布。
但是在实际生产环境中,在容器逐步被调度之后,随着时间的推移、外部因素的变化,节点之间渐渐变得并非理想对等的,有如下情况:
1.节点通过亲和性等方式,仅允许特定应用调度其上(其有多种原因:比如节点有特殊硬件,或者不同应用需要实现节点粒度的资源隔离)。
2.节点的污点和标签也会在容器调度之后被修改,使得之前的调度方法失效。
3.新节点加入,或者老节点出错导致容器被驱逐/迁移。
所以在生产环境中,随着时间的推移、外部因素的变化,原生的Kubernetes调度方法在实际情况下是有缺陷的,无法保证集群负载一如既往的均衡。
而容器相关的开源社区中,也针对这个问题提出了de-scheduler的概念,当其发现容器平台中资源调度的不均衡,会根据一些策略,选择某些容器,进行删除和重新调度。参考资料:https://github.com/kubernetes-incubator/descheduler。
但是de-scheduler方法的最大缺点是“完全自动化”地、“简单”地自行删除容器。而这会导致正在运行中的业务收到影响,比如正在进行的秒杀业务,负载增高,如果被上述方案自行删除和重新调度,业务就会造成短暂性能降级甚至中断,导致秒杀业务受影响。社区为解决该问题的de-scheduler方案,采用直接停止和迁移应用的方式,过于简单粗暴。所以de-scheduler的方案无法在生产环境中大规模推广。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海道客网络科技有限公司,未经上海道客网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864036.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器测试方法及装置
- 下一篇:一种用户行为分析系统、方法及介质