[发明专利]一种实时集群业务监控的实现方法、装置有效
申请号: | 202010820204.5 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111949486B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 彭泽;胡永刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 孙玉营 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 集群 业务 监控 实现 方法 装置 | ||
本发明提供一种实时集群业务监控的实现方法、装置,该方法包括如下步骤:初始化存储池内记录性能的对象;接收业务IO请求并完成对IO请求的响应,将本次IO数据记录在内存中;将内存中记录的数据写入存储池内记录性能的对象;访问存储池内记录性能的对象,来确定集群基本状态及监控集群业务状态。将整个集群中所有的业务压力信息保存在了独立的对象中,通过定时任务心跳的形式进行查询,保证了查询集群性能的时效性。
技术领域
本发明涉及实时集群业务监控技术领域,具体涉及一种实时集群业务监控的实现方法、装置。
背景技术
对于客户来说可以像使用物理硬盘一样格式化并建立任意文件系统来使用块存储,所以块存储适用于大部分通用业务场景下的数据存储,有了越来越广泛的应用。在块存储场景中,卷承担了主要的功能实现和业务输出,目前在统计当前集群压力时,需要通过读取每个卷的元数据中记录的累计IO数量及总带宽实现,该流程需要频繁访问卷的元数据,对集群业务造成一定压力,且当集群规模较大、卷数量多时,该统计方式需要去访问每个卷的元数据所以耗时很长,无法很好的实时观测集群业务压力状态。
发明内容
针对目前在统计当前集群压力时,需要通过读取每个卷的元数据中记录的累计IO数量及总带宽实现,该流程需要频繁访问卷的元数据,对集群业务造成一定压力,且当集群规模较大、卷数量多时,该统计方式需要去访问每个卷的元数据所以耗时很长,无法很好的实时观测集群业务压力状态的问题,本发明提供一种实时集群业务监控的实现方法、装置。
本发明的技术方案是:
一方面,本发明技术方案提供一种实时集群业务监控的实现方法,包括如下步骤:
初始化存储池内记录性能的对象;
接收业务IO请求并完成对IO请求的响应,将本次IO数据记录在内存中;
将内存中记录的性能数据写入存储池内记录性能的对象;
访问存储池内记录性能的对象,来确定集群基本状态及监控集群业务状态。
进一步的,初始化存储池内记录性能的对象的步骤之前包括:
创建每个卷时动态调整记录性能的对象的大小,为每个卷单独分配存储空间,并且在该存储空间中记录新创建卷的卷名。
进一步的,初始化存储池内记录性能的对象的步骤包括:
取消记录性能的对象的对象锁,由于为每个卷单独分配了存储空间,使得多个卷同时将自身性能数据纪录写入记录性能的对象。
进一步的,将内存中记录的性能数据写入存储池内记录性能的对象的步骤包括:
将本次IO完成的时间T2与上次将性能数据写入记录性能的对象的时间戳T1进行对比;
若T2-T1N,不做处理;
若T2-T1≥N,将目前内存中记录性能数据写入记录性能的对象为该卷分配的空间中,其中,N为大于0的时间阈值。保证了核心业务的稳定性。
进一步的,访问存储池内记录性能的对象,来确定集群基本状态及监控集群业务状态的步骤包括:
定时服务以心跳的形式定时访问记录性能的对象;
定时服务在心跳中读取记录性能的对象中记录的数据,统计该时刻集群整体业务压力情况;
若读到的记录性能的对象内的时间戳与集群目前时间的差大于设定的阈值时,则认为记录性能对象中记录的性能数据为旧数据,即认为当前该卷或集群没有业务压力。通过定时任务心跳的形式进行查询,保证了查询集群性能的时效性。
进一步的,定时服务以心跳的形式定时访问记录性能的对象的步骤还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010820204.5/2.html,转载请声明来源钻瓜专利网。