[发明专利]计算回归模型有效
申请号: | 201380070189.5 | 申请日: | 2013-10-24 |
公开(公告)号: | CN104937544A | 公开(公告)日: | 2015-09-23 |
发明(设计)人: | 石静云;梁栋;朱雅珍 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 吴信刚 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 回归 模型 | ||
1.一种方法,包括:
创建记录的处理数据集,其中每个记录包括特定于一组实际子任务中的一个子任务的数据并且包含该组实际子任务的共享数据的参考,并且其中记录的数目等同于该组实际子任务中的实际子任务的数目;
通过一组映射器中的每个映射器接收处理数据集的一个记录;以及
利用接收的一个记录执行分配的子任务以产生输出,以及通过一个单一的简化器,简化该组映射器中的每个映射器的输出以确定任务结果,其中由计算机系统执行至少一个步骤。
2.权利要求1的方法,进一步包括:
基于原始数据集的至少一个特性计算潜在子任务的最大数目;以及
基于可用于执行实际子任务的该组映射器中映射器的数目以及潜在子任务的最大数目,计算要执行的该组实际任务中的实际子任务的数目。
3.权利要求2的方法,进一步包括:
计算实际子任务的数目,指定为M个实际子任务,其中M=2m,其中M≤L并且m<k–1,其中L是可用于执行实际子任务的该组映射器中映射器的数目,其中k是预测因子的数目。
4.权利要求3的方法,进一步包括:
将预测因子分成起始索引预测因子和共索引预测因子。
5.权利要求4的方法,进一步包括:
将全局搜索序列分成M个本地搜索序列;
为每个本地搜索序列从起始索引预测因子中识别起始索引序列;
创建具有M个记录的临时输入文件,其中每个记录包含一个起始索引序列,并且其中每个记录包含共索引预测因子的参考以及要在其上应用扫描操作的矩阵。
6.权利要求5的方法,进一步包括:
在该组映射器的每一个映射器:
接收一个本地搜索序列的起始索引序列;
通过处理数据集的每个记录中的参考接收共索引预测因子和矩阵;
利用共索引预测因子产生共索引序列;
根据起始索引序列在矩阵上执行扫描操作;
根据共索引序列在结果矩阵上执行扫描操作;
识别输出,其中输出为本地回归模型。
7.权利要求6的方法,其中发送起始索引序列而不发送共索引序列到该组映射器中的每一个映射器减少了网络流量。
8.权利要求6的方法,其中任务结果是全局回归模型。
9.权利要求1的方法,其中在云环境中以服务方式提供软件。
10.一种计算机程序产品,包括:
具有计算机可读程序代码的计算机可读介质,当计算机的至少一个处理器执行该计算机可读程序代码时执行:
创建记录的处理数据集,其中每个记录包括特定于一组实际子任务中的一个子任务的数据并且包含该组实际子任务的共享数据的参考,并且其中记录的数目等同于该组实际子任务中的实际子任务的数目;
通过一组映射器中的每个映射器接收处理数据集的一个记录;以及
利用接收的一个记录执行分配的子任务以产生输出,以及通过一个单一的简化器,简化该组映射器中的每个映射器的输出以确定任务结果。
11.权利要求10的计算机程序产品,其中当计算机的至少一个处理器执行该计算机可读程序代码时执行:
基于原始数据集的至少一个特性计算潜在子任务的最大数目;以及
基于可用于执行实际子任务的该组映射器中映射器的数目及潜在子任务的最大数目,计算要执行的该组实际任务中的实际子任务的数目。
12.权利要求10的计算机程序产品,其中当计算机的至少一个处理器执行该计算机可读程序代码时执行:
计算实际子任务的数目,指定为M个实际子任务,其中M=2m,其中M≤L并且m<k–1,其中L是可用于执行实际子任务的该组映射器中映射器的数目,其中k是预测因子的数目。
13.权利要求12的计算机程序产品,其中当计算机的至少一个处理器执行该计算机可读程序代码时执行:
将预测因子分成起始索引预测因子和共索引预测因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380070189.5/1.html,转载请声明来源钻瓜专利网。