[发明专利]对输入数据记录集执行基于集成模型的预测的方法和系统有效
申请号: | 201410359973.4 | 申请日: | 2014-07-25 |
公开(公告)号: | CN104345974B | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | P·塞考兹;M·科罗泊泰克;K·思考罗恩思基 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F3/041 | 分类号: | G06F3/041 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 李玲 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入 数据 记录 执行 基于 集成 模型 预测 方法 系统 | ||
1.一种用于对输入数据记录集(IDS)执行基于集成模型(100)的预测的计算机实现的方法,所述集成模型包括多个树(T1-T3),所述树为决策树或回归树,该方法在控制多个处理单元(CPU1-CPU10)和多个数据切片(DSL1-DSL10)的数据库管理系统中实现,所述数据库管理系统可操作用于通过相应的一个处理单元处理存储在任意一个数据切片中的数据,该方法包括:
-为所述集成模型中的树(T1-T3)中的每个树创建(502)分配表(AT1-AT3),每个分配表将输入数据集中的所有数据记录分配到所述树的根节点(NOT1,NOT2,NOT3);
-将每个分配表拆分(504)成不相交的子表(AXT1.1-AXT1.10;AXT2.1-AXT2.10;AXT3.1-AXT3.10);
-将每个子表存储(506)到相应的一个数据切片中;
-将所有树的根节点(NOT1,NOT2,NOT3)用作(510)对应于所有树的当前级的当前节点集;
-由其各自的数据切片包括一个或多个子表的所有处理单元并行执行(512):
a)对存储在所述处理单元的数据切片中的子表执行(514)单次遍历,从而识别已经被分配到所述数据切片的一个或多个数据记录的一个或多个所述当前节点;
b)针对分配给每个识别的当前节点的数据记录来评估(516)每个识别的当前节点的拆分条件;
c)根据所述评估,将输入数据记录从每个所述当前节点去分配(518)以及将所述输入数据记录重新分配到所述当前节点的一个或多个子节点;
d)将所有当前节点的子节点用作(520)对应于所有树的当前级的当前节点集;以及
e)重复步骤a)-d),直到将所有分配表的所有输入数据记录分配到所述树的叶节点;
-根据数据记录到所有树的叶节点的分配来计算(524)预测结果;
其中每个分配表仅包括数据记录标识符和关联指针,其中每个分配表的数据记录标识符包括所述输入数据集(IDS)的所有输入数据记录的标识符,以及每个关联指针指向树中的一个树的一个或多个当前节点中的一个当前节点,其中与所述标识符中的一个标识符关联的每个指针将所述标识符的数据记录分配到该指针所指的当前节点。
2.根据权利要求1所述的计算机实现的方法,其中每个不相交的子表包括输入数据记录集(IDS)的数据记录标识符的不相交的子集。
3.根据权利要求1所述的计算机实现的方法,该方法还包括由数据库管理系统将子表传递到数据切片并将子表存储到所述数据切片中。
4.根据权利要求3所述的计算机实现的方法,其中所述传递经由网络连接来执行。
5.根据权利要求1所述的计算机实现的方法,该方法还包括:在数据切片中的不同数据切片中存储从同一个分配表获取的所有子表(AXT1.1-AXT1.10;AXT2.1-AXT2.10),其中执行步骤c)包括对从同一个分配表获取的每个子表中包括的数据记录与当前节点的分配进行并行更新。
6.根据权利要求1所述的计算机实现的方法,其中通过由各个数据切片的处理单元并行评估存储在所述数据切片中的子表(AXT1.1-AXT3.10),从而对分配了数据切片中的一个或多个数据记录的一个或多个当前节点进行识别。
7.根据权利要求1所述的计算机实现的方法,其中计算所述预测结果包括:
-对于每个树,将树专用预测计算为输入数据记录到所述树的叶节点的分配的衍生;以及
-根据树专用预测来计算最终预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410359973.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置