[发明专利]集群系统无损业务维护方法有效
申请号: | 201110358244.3 | 申请日: | 2011-11-11 |
公开(公告)号: | CN102394936A | 公开(公告)日: | 2012-03-28 |
发明(设计)人: | 撖美霞;夏章抓;张光旭;于正刚 | 申请(专利权)人: | 青岛海信传媒网络技术有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;H04L12/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 266071 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集群 系统 无损 业务 维护 方法 | ||
技术领域
本发明涉及计算机集群技术领域,特别涉及一种集群系统无损业务维护方法。
背景技术
分布式文件系统(Distributed File System,DFS)是由一个主节点(Master)和至少一个从节点(Slave)组成的集群(Cluster)系统,用于存储和共享在物理上跨网络分布的文件。分布式文件系统中,主节点负责信令处理,从节点负责数据(即文件)处理。共享文件存储于从节点的服务器中,由主节点控制存储、删除;一个共享文件可以在不同的从节点中存储多份。
主节点通过设置集群成员的加减来管辖集群内的从节点。从节点加入集群时,主节点将从节点当作是全新的,加入集群之前存储的内容,主节点完全不信任也不维护;随后,主节点主动向从节点发起心跳信号,从节点回复该心跳信号,之后定期进行心跳信号的发送和应答,从节点回复的心跳信息中包括从节点存储的文件信息和当前业务进度。此后,从节点存储、删除文件完全由主节点控制。从节点退出时,主节点从集群成员中减掉的从节点,主节点不再管理,此后该从节点的数据主节点会当作垃圾数据处理。主节点通过保存在本地的文件维护从节点的存储和业务信息,实现数据持久化,保证主节点重启后,数据不会丢失。
用户应用访问DFS进行各种文件处理业务,如上载共享文件、删除文件或读取文件等,都要通过主节点来驱动从节点,因此,主节点掌握从节点一切对外行为,包括当前处理的任何对外业务,这些都通过主节点在本地存储的文件来维护。
现有技术中,从节点一旦加入主节点的集群,便一直处于工作状态,而一旦退出集群,便处于不受管辖的无用状态。在系统运行的过程中,经常会碰上需要暂时停止使用从节点的情况,如进行日常维护通常需要重启从节点进程或者重启从节点服务器。为避免从节点处于工作状态而又无法访问的状况造成主节点对从节点的管理处于失控状态,现有技术在此时的处理一般都是直接停止业务,使从节点退出集群,在重启后再加入集群重新执行相关业务(或是直接放弃相关业务)。可以看出,现有技术的处理方式可能会导致正在处理的业务执行失败,造成不必要的损失,并且从节点退出再重新加入的过程会在从节点处产生垃圾文件。
发明内容
(一)要解决的技术问题
针对现有技术的缺点,本发明为了解决现有技术中集群系统维护时导致的业务处理失败的问题,提出了一种集群系统无损业务维护方法,通过对从节点的状态管理保证了系统维护时的无损业务处理。
(二)技术方案
为了实现上述目的,本发明采用如下技术方案:
一种集群系统无损业务维护方法,所述方法包括步骤:在需要进行系统维护时,主节点将维护涉及的从节点的状态信息标记为闲置状态,并暂停为该从节点分配新的业务;从节点继续完成当前的业务,若主节点接收到针对该从节点的删除文件命令,只做记录,不向该从节点发起所述删除文件命令;从节点完成当前业务后,主节点将该从节点的状态信息标记为空闲状态,随后该从节点接受相关维护操作;完成维护操作后,主节点将该从节点的状态信息标记为工作状态,并向该从节点发送已记录的所述删除文件命令,从节点根据所述删除文件命令删除文件,主节点更新集群配置文件,随后主节点正常给该从节点分配新业务。
优选地,主从节点之间通过周期性的心跳信息应答来更新从节点的状态信息。
优选地,在从节点处于空闲状态时,主节点仍然保持继续发送心跳信息,并忽略收不到回复的情况,直到收到从节点完成维护操作后回复的心跳信息;在从节点处于工作状态或闲置状态时,当心跳信息有异常时,主节点处理异常。
优选地,主节点以从节点的IP地址作为输入,依据IP地址查找在本地存储的集群配置文件对从节点和集群信息进行设置。
优选地,所述维护操作包括关闭从节点和/或系统、修改从节点和/或系统的配置参数、对从节点和/或系统程序升级、重启从节点和/或系统。
优选地,在某从节点进入闲置状态后,主节点通过计算文件的热点排行产生该从节点中并发访问需求大的文件的备份。
优选地,主节点根据删除文件命令删除对应的备份文件。
优选地,根据所述删除文件命令删除文件时,若文件正在被读取,则延时删除。
优选地,在集群系统中,主节点随时依据文件的访问量做热点统计,将访问量大的文件自动复制到负载较轻的从节点上;在文件访问量变小后,自动删除复制的文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海信传媒网络技术有限公司,未经青岛海信传媒网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110358244.3/2.html,转载请声明来源钻瓜专利网。