[发明专利]在分布式数据库架构中维护会话-主机关系的容错方法有效
申请号: | 201110020100.7 | 申请日: | 2011-01-06 |
公开(公告)号: | CN102591886A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | R·沙玛;胡明 | 申请(专利权)人: | 阿尔卡特朗讯 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 郑立柱 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 数据库 架构 维护 会话 主机 关系 容错 方法 | ||
技术领域
本发明涉及数据库技术,特别涉及分布式的数据库技术。
背景技术
在使用计费收集功能(Charging Collection Function,简称CCF)的IP多媒体系统网络中,计费数据记录(CDR)的互相关联是这样一种功能:它接合了来自各个网元(NE)的要素CDR,这些网元实现了计费触发功能。在一个分布式数据库架构(DDB)中,关联的主机典型地是一个CCF节点,它会被选中从而将负载均衡地分散到CCF节点中。DDB方式具有这样的优点:与传统的、受读写TPS一般处于1000读/写每秒的数量级的商用服务器的读写TPS限制的集中式数据库方式相比,系统地吞吐随着CCF的加入线性地变化。
尽管DDB方式在CCF节点中提供了公平的负载分布,并且增加了系统吞吐,但是下面这些相关的问题使得DDB方式还不够优化:
-关联主机可能无法提供服务(out of service,简称OOS),并继而阻止了关联的完成;
-当一个或多个CCF节点被加入时,正在进行的会话已经要求重新归属以分散处理负载,由于这一阶段的特征是大量的数据从一个数据库到另一个数据库的转移,该转移牵涉到多个源以及目的,这些源和目的最终消耗了很大百分比的CPU周期进行转移,因此在这一阶段中系统的吞吐会降低。而如果不进行重新归属,CCF节点会不正确地计算关联主机,并且不同的CCF节点会将属于相同会话的记录导向至不同的关联主机,这意味着关联功能:
(a)对于相同的会话被执行超过一次,以及
(b)所有的服务器都使用不完整的会话信息进行工作,这带有很大几率使所有相关联的纪录都是不完整的并且在计费协调系统处不被接受。
因此,这种用于处于服务器停运和服务器加入的下雨天场景需要手工来正确地重新计算关联主机以及调整负载分布。
在现有技术中,已经提出了一种解决方案克服以上问题,下面将结合图1至3给予说明
·现有技术:当关联主机无法提供服务
一个关联主机根据f(Key)被选中,其中,该key典型的是被分配给被记账的会话的IMS计费标识(ICID),并且该key被多个作为计费触发功能(CTF)的网元所报告,其中该ICID被保证为在网络中对于一段时间内,例如一个月内唯一。被使用在ICID上的函数是一个哈希函数,并且该结果确定关联主机。该方法确保:属于同一关联对象的记账记录被发送给单个关联主机,并且平均来说每个CCF节点接纳了大致相同数量的处理负载。在实践中,一个关联对象可以具有多于一个正在进行的、由CTF所报告的记账会话。
作为一个例子,考虑具有3个CCF节点:CCF节点1至CCF节点3(下面简称为CCF1至CCF3)的网络。假定目前CCF2无法提供服务。对于一些正在进行会话,CCF1和CCF3能够通过对该些会话相应的ICID施加f(Key)来了解到关联主机是CCF2。由于CCF1和CCF3无法与CCF2通信,例如计费相关信息等新的会话记录会被插入到这各个服务器的本地缓存中。当CCF2恢复后,CCF1和CCF3检测到其可用性,继而将这些被缓存的会话记录发送给由CCF2拥有并且作为主机的数据库中。
这一方式的问题在于:没有办法预先得知CCF2的停运将会持续多久。因此,本地缓存的解决方案只能在一定程度上起作用。在一段时间后,本地缓存将变得无法存储记账信息,继而该解决方案失败。当缓存充满时,在这一时刻可以使用回滚机制产生不关联的CDR,从而来清空缓存并且避免丢失记录。这一方式相关的问题在于:很多用户拒绝支付不关联的CDR,这意味着这些呼叫或会话将无法被记账,使用者也不会对它们被开具帐单。这产生了收入泄漏问题
·现有技术:当将一个或多个CCF节点加入到可用的服务器簇中
对于现有的网络,当增加服务器时,复杂的一系列处理将被运行:这些处理首先设立该被加入的一个或多个服务器,暂停目前已有的服务器上的处理,更新各服务器的内部表格以添加被加入的一个或多个服务器的标记,在所更新的服务器数中重新归属正在进行的会话,之后继续处理并恢复正常状态。该处理的每个阶段都具有精心设计的差错处理进程,并且它还需要人工介入以解决下雨天场景。
作为这一方式的两个主要缺点,以下这些点值得注意:
-与精心设计的差错处理进程相关的复杂的一系列步骤需要操作员参照差错日志并且基于失效点使用恢复机制;
-正常的处理被暂停,会话被重新归属以及耦合,这样带来的事实是:该过程的运行可能出现问题,处理暂停的时间对于网络运营商来说可能无法接受;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔卡特朗讯,未经阿尔卡特朗讯许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110020100.7/2.html,转载请声明来源钻瓜专利网。