[发明专利]Ceph中OSD侧主从间IO信息监控方法、装置、设备及介质有效
申请号: | 202011281879.3 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112306815B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 闵顺新 | 申请(专利权)人: | 新华三大数据技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ceph osd 主从 io 信息 监控 方法 装置 设备 介质 | ||
本公开提供了一种Ceph中OSD侧主从间IO信息监控方法、装置、设备及介质,其中,所述方法包括:逻辑集合PG层的各个逻辑集合PG统计所述逻辑集合PG所映射的所有OSD列表中,主OSD和从OSD之间的统计信息;对象存储设备OSD层统计全部统计信息;OSD发布异常统计信息,Ceph的集群监控进程MON收集并汇总所述异常统计信息。本公开实现OSD侧主从间的IO信息统计。本公开基于OSD之间的IO统计信息,本公开可以通过日志打印的方式,实现对集群运行过程中OSD之间慢IO和链接异常等常见故障场景的监控。本公开基于OSD之间的IO统计信息,本公开可以为进一步的故障判断和修复提供依据。
技术领域
本公开涉及计算机信息监控技术领域,更为具体来说,本公开涉及Ceph中OSD侧主从间IO信息监控方法、装置、设备及介质。
背景技术
Ceph作为一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式的存储系统,目前已经成为最流行的开源存储解决方案之一。
在Ceph存储系统中,OSD进程会对收到的消息进行解析,如果是OP类型的操作。就会新建一个OpRequest对象,这个对象贯穿整个操作的执行过程,直至完成销毁,Ceph提供了OpTracker机制来跟踪这个对象,记录一些事件,帮助我们进行性能分析与调优。通过OpTracker机制,可以实现以下功能:
1)跟踪OP的执行过程,在某些特定时间点标记某种事件的发生;当一个OP处理的时间超过某个阈值时,就会打印警告信息。这些信息可以用于以后的分析。
2)跟踪记录已经完成的OP。通过向OSD发送dump命令,可以查看历史中某段时间内一定数目的OP信息。
现有技术具有监控粒度太小,主要以每个OP为对象,无法形成主从OSD之间IO信息统计;监控的IO信息没有很好地汇总,不能用于进一步作为修复OSD间故障的依据;由于监控粒度太小,对每个OP监控会对集群IO性能造成一定影响。集群实际运行过程中不会打开OpTracker的开关,无法通过OpTracker机制获取有用的统计信息的技术问题。
发明内容
为解决现有技术的对当前Ceph集群业务延时过长的相关问题统计,主要的原因有慢IO、链接问题、Peering挂住3大问题。本公开所要解决的是对主从OSD之间慢IO和链接异常的监控的技术问题。
为实现上述技术目的,本公开提供了一种Ceph中OSD侧主从间IO信息监控的方法,包括:
逻辑集合PG层的各个逻辑集合PG统计所述逻辑集合PG所映射的所有OSD列表中,主OSD和从OSD之间的统计信息;
对象存储设备OSD层统计全部统计信息;
OSD发布异常统计信息,Ceph的集群监控进程MON收集并汇总所述异常统计信息。
进一步,所述统计信息具体包括:
一定时间周期内经过IO路径的所有OP的运行状况,其中,所述运行状况具体包括:返回的OP总数、返回错误码的IO数、IO的平均时延、挂死OP数目。
进一步,所述逻辑集合PG统计所述逻辑集合PG所映射的所有OSD列表中,主OSD和从OSD之间的统计信息具体包括:
对于每个所述逻辑集合处理的每个OP,
在发送OP的阶段记录发送时间;
在从主OSD传输到从OSD的链路传输过程中记录接收时间;
并记录得到一定时间周期内所述逻辑集合PG处理的和任一从OSD之间的所有OP的总时延、返回的IO总数、返回错误码的IO数。
进一步,所述对象存储设备OSD层统计全部统计信息具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011281879.3/2.html,转载请声明来源钻瓜专利网。