[发明专利]数据仓库环境中的语义分组数据的并行处理有效
申请号: | 201210438539.6 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103150145B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | A·赫尔曼;H·杰克希施 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据仓库 环境 中的 语义 分组 数据 并行 处理 | ||
1.一种计算机实现的方法,所述方法用于由应用层的数据仓库应用服务器利用任务来并行地处理数据,其中不同的任务并行地运行在所述数据仓库应用服务器上,其中每个任务处理包括与语义关键词相关联的多个数据记录的数据分组,其中每个数据分组是数据的子集,以及其中数据存储在数据库层的源系统中,所述方法包括:
将应用专用表从所述源系统取回给运行在数据仓库应用服务器上的数据仓库应用的数据源;
由数据仓库应用的一个或多个处理器从所述数据源生成数据存储对象,该数据存储对象具有多个记录;
由所述一个或多个处理器添加哈希值到每个记录,该哈希值具有整数域,所述一个或多个处理器将哈希值均匀地分布到跨越数据存储对象的整数域,其中通过将哈希函数应用到语义关键词使得语义关键词的输入域被映射到整数域来生成哈希值;
由所述一个或多个处理器生成选择表,以基于哈希值的多个离散范围创建多个任务,其中所述哈希值的多个离散范围中的每个范围提供用于生成信息块的特定数据分组;以及
由所述一个或多个处理器在多个任务的每一个上并行地执行转换例程以生成多个数据的信息块,每个信息块对应于哈希值的离散范围的各个范围,其中执行转换例程包括识别通过生成对选择表的查找要开始的任务的数量,以及其中执行转换例程还包括多个任务中的每一个:
利用所述一个或多个处理器从所述选择表中读取一个或多个选择标准;和
利用所述一个或多个处理器根据所述选择标准从所述数据存储对象中读取数据。
2.如权利要求1所述的方法,其中所述转换例程在所述数据存储对象和每个相应信息块之间实施应用逻辑。
3.一种非临时性机器可读介质,其上存储有计算机程序指令,当所述计算机程序指令由至少一个可编程处理器执行时引起所述至少一个可编程处理器执行包括下列操作的操作:
由应用层的数据仓库应用服务器利用任务来并行地处理数据,其中不同的任务并行地运行在所述数据仓库应用服务器上,其中每个任务处理包括与语义关键词相关联的多个数据记录的数据分组,其中每个数据分组是数据的子集,以及其中数据存储在数据库层的源系统中;
将应用专用表从所述源系统取回给运行在数据仓库应用服务器上的数据仓库应用的数据源;
由数据仓库应用的一个或多个处理器从所述数据源生成数据存储对象,该数据存储对象具有多个记录;
由所述一个或多个处理器添加哈希值到每个记录,该哈希值具有整数域,所述一个或多个处理器将哈希值均匀地分布到跨越数据存储对象的整数域,其中通过将哈希函数应用到语义关键词使得语义关键词的输入域被映射到整数域来生成哈希值;
由所述一个或多个处理器生成选择表,以基于哈希值的多个离散范围创建多个任务,其中所述哈希值的多个离散范围中的每个范围提供用于生成信息块的特定数据分组;以及
由所述一个或多个处理器在多个任务的每一个上并行地执行转换例程以生成多个数据的信息块,每个信息块对应于哈希值的离散范围的各个范围,其中执行转换例程包括识别通过生成对选择表的查找要开始的任务的数量,以及其中执行转换例程还包括多个任务中的每一个:
利用所述一个或多个处理器从所述选择表中读取一个或多个选择标准;和
利用所述一个或多个处理器根据所述选择标准从所述数据存储对象中读取数据。
4.如权利要求3所述的非临时性机器可读介质,其中所述转换例程在所述数据存储对象和每个相应信息块之间实施应用逻辑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210438539.6/1.html,转载请声明来源钻瓜专利网。