[发明专利]服务器智能管理中二维数据与管理策略迁移方法无效

专利信息
申请号: 201110372510.8 申请日: 2011-11-22
公开(公告)号: CN102521204A 公开(公告)日: 2012-06-27
发明(设计)人: 于治楼;张化祥;张云涛 申请(专利权)人: 浪潮电子信息产业股份有限公司
主分类号: G06F15/18 分类号: G06F15/18;H04L29/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种服务器智能管理中二维数据与管理策略迁移方法,由于受时间、设备等因素影响,无法采集到服务器所有的健康信息,从而无法使用机器学习技术获取每台服务器的管理策略,为了解决上述问题,采用KNN(K最近邻)均值法分别计算源服务器健康信息和目标服务器健康信息对应项目的平均值,再对源服务器的数据进行处理,使它具有与目标服务器数据相同的分布特征,实现服务器健康信息的数据迁移,提高依据数据学习到知识的可靠性,同时可实现从源服务器到目标服务器管理知识的迁移。
搜索关键词: 服务器 智能 管理 二维 数据 策略 迁移 方法
【主权项】:
1.服务器智能管理中二维数据与管理策略迁移方法, 其特征在于包括如下内容:1)迁移学习方案,先做如下定义:在一个学习目标服务器规律的任务中,有一个源服务器的训练数据集表示第个样例,表示它的类标签,是训练数据的个数,中的样例服从一个固定的但未知的分布,还有少量的目标服务器的训练数据集服从另一个固定的但未知的分布,并用表示,表示第个样例,表示它的类标签,中的每一个样例使用的类标签来自同一个类标签集合,包括具有个成员的有限集合,数据迁移的任务就是从中提取出有用的信息用在目标服务器知识学习的任务上,并且找到一个对目标服务器数据预测分类精度较高的映射函数;2)把分成不同的子集,每个子集里面的数据都是同一类,这些数据表示为,对于中的一个特定的子集中的类标签,随机选取个样例,计算这些被选样例的平均值,这个平均值是一个合成数据,并作为用类标号标记的样本,对于的样例个数,用同样的方法生成个合成样本,当所有的的子集都处理完,这样就生成了个合成数据集,  每一个个平均值作为它的成员,作为每一个成员的类标签,当m趋于无穷大时,这些合成数据服从不同的多元正态分布,并且如果它们之间相互独立,同一类别的数据服从同一个多元正态分布,例如的合成数据服从多元正态分布,平均值通过计算得出协方差,式中的是样例个数的维度,是一个非对角线协方差矩阵,通过计算,得出非对角线上的数据表示特征间的相关性,假设特征间是相互独立的,那么非对角线上的项都为0, 忽略掉非对角线上的数据,只考虑对角线上的数据,对于从中抽取的每一个子集的成员生成各自相应的合成数据,每个合成数据有两个值:每一类数据中的均值和协方差矩阵,把以上生成合成数据的方法称为随机平均数法,对于所有的合成数据集,用表示平均值, 用表示协方差;3)对数据集做一些处理,使它具有与.相同的分布,对于一个有完整协方差矩阵的多元正态分布,概率密度函数如下所示:.a其中是一个n维的随机变量,如果特征相互独立,协方差矩阵会简化为一个对角矩阵,.(b对于中的每一个合成样例,进行如下的转换:.(c其中表示中的第j个组成向量;这样通过公式c的转换,得到了一个新的合成数据,它服从均值为、协方差为的多元正态分布;4)给定目标服务器的数据服从均值为协方差为的多元正态分布,通过公式c的转换,合成数据()服从均值为和协方差为的多元正态分布,可以和少量的目标服务器的数据一起作为目标服务器的训练数据;5)如果每个数据是由它最近邻的几个数据的均值生成的,它效果会比使用随机平均数更好,把这种生成合成数据的方法称为KNN值,在具体实施方式中将采用KNN均值来生成数据;6)将通过步骤(2)合成的训练数据用于机器学习,实现训练数据的迁移和获取知识的迁移;迁移步骤如下:1)数据集的采集利用服务器管理平台采集各服务器在同一时间的健康信息以及某台服务器在不同时间的健康信息;2)目标服务器训练数据集的构造,算法如下:输入:, 目标服务器数据集,源服务器数据集输出: 目标服务器合成数据及算法:把按照数据的类标号分成几个不同数据子集对于每一个, 计算,,对于中的每个样例, 通过KNN均值生成合成样例对于中的每个样例, 通过KNN均值生成合成样例对于每一个{用公式c对每一个中的样例进行转换形成,并用用类标i标注,形成目标服务器合成数据集}通过以上算法将形成的合成数据和现有的数据一起作为目标服务器的规则学习的训练数据;3)采用不同的迁移方法对目标服务器管理策略的学习;(1)横向迁移:依据现有的在相同时间采集到的源服务器健康信息,采用不同服务器间的数据迁移策略,形成合成数据与目标服务器的少量数据一起作为当前目标服务器的经验数据,采用关联规则技术学习服务器管理策略;(2)纵向迁移:依据同一服务器在不同时间采集到的健康信息作为源数据,采用同服务器不同时间段的数据迁移策略,形成数据在时间段上的迁移,将迁移后的数据与目标时间段的数据一起作为经验数据,学习服务器的管理策略;     (3)知识迁移:将服务器在相同时间内的管理策略向其他服务器迁移,对每一条知识经过模糊置信评价后,对知识的置信度进行调整,将置信度高于规定阈值的知识作为目标服务的知识。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110372510.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top