[发明专利]一种挖掘KPI根因的方法及装置在审
申请号: | 201710620470.1 | 申请日: | 2017-07-26 |
公开(公告)号: | CN109947760A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 杨育彬;范仕良;卢文羊;宋平 | 申请(专利权)人: | 华为技术有限公司;南京大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据集 决策树 存储路径 挖掘 读取 通信技术领域 记录 采集 查找 | ||
1.一种挖掘关键绩效指标KPI根因的方法,其特征在于,包括:
获取参数,所述参数包括KPI报表的存储路径以及待挖掘的异常KPI项;
根据所述KPI报表的存储路径读取KPI报表,所述KPI报表包括N行,M列,所述N和所述M均为大于或者等于1的正整数;其中,一列用于存储一个特征,一个特征为一个KPI项,一个所述KPI项包括该KPI标识和对应的特征值,所述待挖掘的异常KPI项为所述KPI报表中的一个特征;一行用于存储一条记录;
执行以下步骤101-102至少一次,获取至少一个决策树;
101、采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集;其中,所述训练数据集包括M个特征,P条记录,所述P为大于或者等于1的正整数;所述第一记录为所述待挖掘的异常KPI项中的特征值为正常数据的记录,所述第二记录为所述待挖掘的异常KPI项中的特征值为异常数据的记录;所述P小于或者等于所述N;
102、根据所述训练数据集的M个特征,分别对所述训练数据集进行训练,得到决策树;其中,所述决策树包括至少两层节点,一个非叶节点为所述训练数据集的一个特征的特征值确定的训练条件,该非叶节点的第一子节点包含所述训练数据集中满足所述非叶节点的训练条件的记录,该非叶节点的第二子节点包含所述训练数据集中不满足所述非叶节点的训练条件的记录;一个非叶节点的训练条件与该非叶节点的子节点的训练条件不同;
根据所述至少一个决策树确定目标KPI根因,所述目标KPI根因为所述KPI报表中使得所述待挖掘的异常KPI项异常的特征。
2.根据权利要求1所述的方法,其特征在于,所述采集所述KPI报表中至少一条第一记录和至少一条第二记录,生成训练数据集,包括:
根据每个KPI项的特征值对所述KPI项所处列的缺省值赋值;
对所述待挖掘的异常KPI项中的特征值标注属性信息,所述属性信息用于指示所述待挖掘的异常KPI项中的特征值为正常数据或者异常数据;
根据所述KPI报表中的属性信息,采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述对所述待挖掘的异常KPI项中的特征值标注属性信息,包括:
判断所述待挖掘的异常KPI项中的特征值是否大于或者等于第一阈值;
当所述待挖掘的异常KPI项中的特征值大于或者等于所述第一阈值时,则标注该特征值为第一属性信息,所述第一属性信息用于指示所述待挖掘的异常KPI项中的特征值为正常数据;
当所述待挖掘的异常KPI项中的特征值小于所述第一阈值时,则标注该特征值为第二属性信息,所述第二属性信息用于指示所述待挖掘的异常KPI项中的特征值为异常数据。
4.根据权利要求2或3所述的方法,其特征在于,所述参数还包括数据采样比率Ra;
相应的,所述根据所述KPI报表中的属性信息,采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集,包括:
计算所述KPI报表中的每一条记录pi的置信度c(pi),i=0,1,2,...,P-1,P为所述KPI报表中包含的记录的条数;
从所述KPI报表中随机采集条所述第一记录,以及从所述KPI报表中随机采集条c(pi)>random(0,1)的所述第二记录,得到所述训练数据集;其中,random(0,1)为一个随机函数,random(0,1)用于生成一个取值范围为0~1的随机数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;南京大学,未经华为技术有限公司;南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710620470.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据索引建立方法、索引检索方法及装置
- 下一篇:存储管理系统和方法