[发明专利]一种数据处理方法和计算机系统有效
申请号: | 201480003034.4 | 申请日: | 2014-06-27 |
公开(公告)号: | CN104798043B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 彭渊;谢元智 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 计算机系统 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
计算机系统对数据样本进行离散化处理,得到矩阵形式的数据样本;
所述计算机系统根据预设的分类方法,对所述矩阵形式的数据样本进行训练,得到分类规则集;
所述计算机系统利用数据决策平台识别的表达形式,将所述分类规则集转换为所述数据决策平台识别的分类规则集;
所述计算机系统将所述转换得到的所述数据决策平台识别的分类规则集提供给所述数据决策平台。
2.根据权利要求1所述的方法,其特征在于,所述预设的分类方法为决策树算法;
则所述计算机系统根据预设的分类方法,对所述矩阵形式的数据样本进行训练,得到分类规则集;所述计算机系统利用数据决策平台识别的表达形式,将所述分类规则集转换为所述数据决策平台识别的分类规则集包括:
所述计算机系统根据所述决策树算法,对所述矩阵形式的数据样本进行训练,得到决策树形式的分类规则集;
所述计算机系统利用所述数据决策平台识别的表达形式,将所述决策树形式的分类规则集转换为所述数据决策平台识别的分类规则集。
3.根据权利要求2所述的方法,其特征在于,所述计算机系统包括主计算节点和多个决策树计算节点;
则所述计算机系统根据所述决策树算法,对所述矩阵形式的数据样本进行训练,得到决策树形式的分类规则集包括:
所述主计算节点发送决策树计算命令给每个所述决策树计算节点;
每个所述决策树计算节点根据所述决策树计算命令,利用所述决策树算法对部分所述矩阵形式的数据样本进行训练,得到决策树形式的分类规则;
所述决策树形式的分类规则集为每个所述决策树计算节点得到的决策树形式的分类规则的集合。
4.根据权利要求3所述的方法,其特征在于,所述主计算节点发送决策树计算命令给每个所述决策树计算节点;每个所述决策树计算节点根据所述决策树计算命令,利用所述决策树算法对部分所述矩阵形式的数据样本进行训练,得到决策树形式的分类规则包括:
所述主计算节点获取算法配置参数,所述算法配置参数包括所述矩阵形式的数据样本中训练样本的信息以及参与决策树生成的属性的信息;
所述主计算节点发送所述决策树计算命令给每个所述决策树计算节点,所述决策树计算命令携带所述算法配置参数;
每个所述决策树计算节点根据所述决策树计算命令携带的所述算法配置参数,从所述矩阵形式的数据样本中确定训练样本和参与决策树生成的属性,并根据所述确定的参与决策树生成的属性对所述确定的训练样本进行训练,得到决策树形式的分类规则。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述主计算节点在确定每个所述决策树计算节点都得到决策树形式的分类规则之后,发送测试命令给每个所述决策树计算节点;
每个所述决策树计算节点根据所述测试命令,从所述矩阵形式的数据样本中获得测试样本集,并利用自身得到的决策树形式的分类规则对所述测试样本集进行测试,得到测试结果集;
所述主计算节点获取每个所述决策树计算节点得到的测试结果集;
所述主计算节点根据预设的投票规则和每个所述决策树计算节点得到的测试结果集,确定测试的准确率;
当测试的准确率在预设合理范围内时,所述主计算节点执行将所述分类规则集转换为所述数据决策平台识别的分类规则集的步骤。
6.根据权利要求4或5所述的方法,其特征在于,所述矩阵形式的数据样本中训练样本的信息包括所述矩阵形式的数据样本的存储地址、所述矩阵形式的数据样本中的训练样本与测试样本的比例、以及随机获取样本的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480003034.4/1.html,转载请声明来源钻瓜专利网。