[发明专利]服务器智能管理中二维数据与管理策略迁移方法无效

申请号：	201110372510.8	申请日：	2011-11-22
公开（公告）号：	CN102521204A	公开（公告）日：	2012-06-27
发明（设计）人：	于治楼;张化祥;张云涛	申请（专利权）人：	浪潮电子信息产业股份有限公司
主分类号：	G06F15/18	分类号：	G06F15/18;H04L29/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	250014 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	服务器智能管理二维数据策略迁移方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.服务器智能管理中二维数据与管理策略迁移方法, 其特征在于包括如下内容：

1）迁移学习方案，先做如下定义：

在一个学习目标服务器规律的任务中，有一个源服务器的训练数据集表示第个样例，表示它的类标签，是训练数据的个数，中的样例服从一个固定的但未知的分布，还有少量的目标服务器的训练数据集服从另一个固定的但未知的分布，并用表示，表示第个样例，表示它的类标签，和中的每一个样例使用的类标签来自同一个类标签集合，包括具有个成员的有限集合，数据迁移的任务就是从中提取出有用的信息用在目标服务器知识学习的任务上，并且找到一个对目标服务器数据预测分类精度较高的映射函数；

2）把分成不同的子集，每个子集里面的数据都是同一类，这些数据表示为，对于中的一个特定的子集，是中的类标签，随机选取个样例，计算这些被选样例的平均值，这个平均值是一个合成数据，并作为用类标号标记的样本，对于的样例个数，用同样的方法生成个合成样本，当所有的的子集都处理完，这样就生成了个合成数据集, 每一个有个平均值作为它的成员，作为每一个成员的类标签，当m趋于无穷大时，这些合成数据服从不同的多元正态分布，并且如果它们之间相互独立，同一类别的数据服从同一个多元正态分布，例如的合成数据服从多元正态分布，平均值通过计算得出协方差，式中的是样例个数的维度，是一个非对角线协方差矩阵，通过计算，得出非对角线上的数据表示特征间的相关性，假设特征间是相互独立的，那么非对角线上的项都为0，忽略掉非对角线上的数据，只考虑对角线上的数据，对于从和中抽取的每一个子集的成员生成各自相应的合成数据，每个合成数据有两个值：每一类数据中的均值和协方差矩阵，把以上生成合成数据的方法称为随机平均数法，对于所有的合成数据集，用表示平均值, 用表示协方差；

3）对数据集做一些处理，使它具有与.相同的分布，对于一个有完整协方差矩阵的多元正态分布，概率密度函数如下所示：

其中是一个n维的随机变量，如果特征相互独立，协方差矩阵会简化为一个对角矩阵，

.(b

对于中的每一个合成样例，进行如下的转换：

.(c

其中表示中的第j个组成向量；

这样通过公式c的转换，得到了一个新的合成数据，它服从均值为、协方差为的多元正态分布；

4）给定目标服务器的数据服从均值为协方差为的多元正态分布，通过公式c的转换，合成数据和()服从均值为和协方差为的多元正态分布，可以和少量的目标服务器的数据一起作为目标服务器的训练数据；

5）如果每个数据是由它最近邻的几个数据的均值生成的，它效果会比使用随机平均数更好，把这种生成合成数据的方法称为KNN值，在具体实施方式中将采用KNN均值来生成数据；

6)将通过步骤（2）合成的训练数据用于机器学习，实现训练数据的迁移和获取知识的迁移；

迁移步骤如下：

1）数据集的采集