[发明专利]对输入数据记录集执行基于集成模型的预测的方法和系统有效

专利信息
申请号: 201410359973.4 申请日: 2014-07-25
公开(公告)号: CN104345974B 公开(公告)日: 2017-10-13
发明(设计)人: P·塞考兹;M·科罗泊泰克;K·思考罗恩思基 申请(专利权)人: 国际商业机器公司
主分类号: G06F3/041 分类号: G06F3/041
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 李玲
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种对输入数据记录集(IDS)执行基于集成模型(100)的预测的方法和系统,该方法包括为所述集成模型中的每个树创建(502)分配表(AT1‑AT3),每个分配表将输入数据集中的所有数据记录分配到所述树的根节点(NOT1,NOT2,NOT3);将每个分配表拆分(504)成不相交的子表(AXT1.1‑AXT1.10;AXT2.1‑AXT2.10;AXT3.1‑AXT3.10);将每个子表存储(506)到相应的一个数据切片中;将所有树的根节点(NOT1,NOT2,NOT3)用作(510)对应于所有树的当前级的当前节点集;由其各自的数据切片包括一个或多个子表的所有处理单元并行执行(512)一次或多次迭代,从而将数据记录从树的当前节点分配和去分配;以及根据数据记录到所有树的叶节点的分配来计算预测结果。
搜索关键词: 输入 数据 记录 执行 基于 集成 模型 预测 方法 系统
【主权项】:
一种用于对输入数据记录集(IDS)执行基于集成模型(100)的预测的计算机实现的方法,所述集成模型包括多个树(T1‑T3),所述树为决策树或回归树,该方法在控制多个处理单元(CPU1‑CPU10)和多个数据切片(DSL1‑DSL10)的数据库管理系统中实现,所述数据库管理系统可操作用于通过相应的一个处理单元处理存储在任意一个数据切片中的数据,该方法包括:‑为所述集成模型中的树(T1‑T3)中的每个树创建(502)分配表(AT1‑AT3),每个分配表将输入数据集中的所有数据记录分配到所述树的根节点(NOT1,NOT2,NOT3);‑将每个分配表拆分(504)成不相交的子表(AXT1.1‑AXT1.10;AXT2.1‑AXT2.10;AXT3.1‑AXT3.10);‑将每个子表存储(506)到相应的一个数据切片中;‑将所有树的根节点(NOT1,NOT2,NOT3)用作(510)对应于所有树的当前级的当前节点集;‑由其各自的数据切片包括一个或多个子表的所有处理单元并行执行(512):a)对存储在所述处理单元的数据切片中的子表执行(514)单次遍历,从而识别已经被分配到所述数据切片的一个或多个数据记录的一个或多个所述当前节点;b)针对分配给每个识别的当前节点的数据记录来评估(516)每个识别的当前节点的拆分条件;c)根据所述评估,将输入数据记录从每个所述当前节点去分配(518)以及将所述输入数据记录重新分配到所述当前节点的一个或多个子节点;d)将所有当前节点的子节点用作(520)对应于所有树的当前级的当前节点集;以及e)重复步骤a)‑d),直到将所有分配表的所有输入数据记录分配到所述树的叶节点;‑根据数据记录到所有树的叶节点的分配来计算(524)预测结果;其中每个分配表仅包括数据记录标识符和关联指针,其中每个分配表的数据记录标识符包括所述输入数据集(IDS)的所有输入数据记录的标识符,以及每个关联指针指向树中的一个树的一个或多个当前节点中的一个当前节点,其中与所述标识符中的一个标识符关联的每个指针将所述标识符的数据记录分配到该指针所指的当前节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410359973.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top