[发明专利]应用实例数量的调整方法及装置在审
申请号: | 202210303688.5 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114844843A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 李丹;李峻峰 | 申请(专利权)人: | 清华大学 |
主分类号: | H04L47/263 | 分类号: | H04L47/263;H04L43/0852 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 肖艳 |
地址: | 100084 北京市海淀区双清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用 实例 数量 调整 方法 装置 | ||
本发明涉及通信领域,提供一种应用实例数量的调整方法及装置,方法包括:获取入口网关处的请求到达信息、应用实例的初始数量、应用实例的运行状态信息和服务响应时延要求;基于入口网关处的请求到达信息、应用实例的初始数量、应用实例的运行状态信息和服务响应时延要求,确定应用实例的目标数量;将应用实例的初始数量调整至目标数量。由于调整过程中综合考虑到了入口网关处的请求到达状况、应用实例的运行状态以及用户的时延需求,可以通过应用实例数量的自动伸缩提高资源利用率,还可以满足用户的服务响应时延要求,有效解决了现有的无服务平台中自动伸缩机制无法满足用户的服务响应时延要求,且存在服务器集群的资源利用率低的问题。
技术领域
本发明涉及通信技术领域,尤其涉及一种应用实例数量的调整方法及装置。
背景技术
无服务(Serverless)是一种新型的云计算架构,可以使用户无需关注底层服务器的管理和维护,且支持简单快捷的应用部署方式和弹性伸缩机制。
然而,在无服务平台中,现有的自动伸缩机制无法满足用户的服务响应时延要求,且存在服务器集群的资源利用率低的问题。
发明内容
本发明提供一种应用实例数量的调整方法及装置,用以解决现有技术中自动伸缩机制无法满足用户的服务响应时延要求,且存在服务器集群的资源利用率低的缺陷。
第一方面,本发明提供一种应用实例数量的调整方法,该方法包括:
获取入口网关处的请求到达信息、应用实例的初始数量、应用实例的运行状态信息以及服务响应时延要求;
基于所述入口网关处的请求到达信息、应用实例的初始数量、应用实例的运行状态信息和服务响应时延要求,确定所述应用实例的目标数量;
将所述应用实例的初始数量调整至所述目标数量。
根据本发明提供的应用实例数量的调整方法,基于所述入口网关处的请求到达信息、应用实例的初始数量、应用实例的运行状态信息和服务响应时延要求,确定所述应用实例的目标数量,包括:
基于所述入口网关处的请求到达信息和所述应用实例的运行状态信息,确定第一阈值;
将所述应用实例的初始数量与所述第一阈值进行比较,得到第一比较结果;
基于所述应用实例的运行状态信息和所述服务响应时延要求,确定第二阈值;
将所述应用实例的运行状态信息中平均队列长度与所述第二阈值进行比较,得到第二比较结果;
基于所述第一比较结果和所述第二比较结果,确定所述应用实例的目标数量。
根据本发明提供的应用实例数量的调整方法,所述入口网关处的请求到达信息包括平均请求到达速率。
根据本发明提供的应用实例数量的调整方法,基于所述入口网关处的请求到达信息和所述应用实例的运行状态信息,确定第一阈值,包括:
将所述平均请求到达速率与所述运行状态信息中平均单个应用实例的处理能力相除,得到第一阈值。
根据本发明提供的应用实例数量的调整方法,基于所述应用实例的运行状态信息和所述服务响应时延要求,确定第二阈值,包括:
将所述服务响应时延要求与所述应用实例的运行状态信息中平均单个请求完成时长做差,得到时长差值;
将所述运行状态信息中平均单个应用实例的处理能力与所述时长差值相乘,得到第二阈值。
根据本发明提供的应用实例数量的调整方法,基于所述第一比较结果和所述第二比较结果,确定所述应用实例的目标数量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210303688.5/2.html,转载请声明来源钻瓜专利网。