[发明专利]报告OLTP数据的无ETL零冗余系统和方法有效

专利信息
申请号: 200880108120.6 申请日: 2008-09-22
公开(公告)号: CN101828182A 公开(公告)日: 2010-09-08
发明(设计)人: 亚历山大·泽埃尔;安雅·博格;扬·沙夫纳;延斯·克吕格尔;哈索·普拉特纳 申请(专利权)人: 哈索-普拉特纳-研究所软件系统有限责任公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 余刚;吴孟秋
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 报告 oltp 数据 etl 冗余 系统 方法
【说明书】:

相关申请交叉参考

本申请要求于2007年9月21日递交的标题为“报告OLTP数 据的无ETL零冗余系统和方法”的美国临时申请第60/994,893号的 优先权,其全部内容通过引用结合于此。

技术领域

发明涉及数据库系统,具体地,涉及事务型数据库系统和报 告型数据库系统。

背景技术

除非本文另有说明,在本部分所述的方法不是本申请中的权利 要求的现有技术,并不因为包含在本部分中就承认其是现有技术。

商务智能(BI)系统为公司提供了对其数据进行收集、分析和 访问的广泛功能。从公司内多个异构源和可能的附加外部源收集数 据,以创建作为综合知识库并用于高效报告的集成数据集。

当前技术中BI系统的体系结构依靠集中式数据仓库(DW)或 多个非集中式数据集市(data mart)来存储集成的数据集。从事务 型系统收集数据并将其传输到专用存储器的过程称为抽取、转换和 加载(ETL)。“它是迄今为止在任何BI项目中要设计和开发的最复 杂的处理。”[见L.T.Moss和S.Atre,“商务智能路标:决策支持 应用的完整项目生命周期”(Business Intelligence Roadmap:The Complete Project Lifecycle for Decision-Support Applications)第229 页(Addison-Wesley,2003).]根据Ankorion,传统地,基于每周 一次或每月一次定期地运行ETL处理。[见I.Ankorion,改变数据 捕获——用于实时BI的高效ETL(Change Data Capture-Efficient ETL for Real-Time BI),DM评论杂志(DM Review Magazine)(2005 年1月)。]ETL处理通常在低系统负载窗口期间作为批量作业来运 行,因为只可能在低质量下可用的转换和清理数据占用大量的资 源。这意味着BI系统中的数据并非总是最新的,这可能对公司造 成必须实时对问题作出反应的难题(例如,在银行业务中)。

参考Liang和Yu的文章,只需将所关心的数据复制到BI系 统中,而不必将所有的数据复制到BI系统中。[见W.Liang和J.X. Yu,再访问数据仓库中的视图维护(Revisit on View Maintenance in Data Warehouse),第二届Web时代信息管理进展国际会议会刊 (Proceedings of the Second International Conference on Advances in Web-Age Information Management)第203-211页,(Springer-Verlag, 伦敦,英国,2001)。]此外,通常地聚集数据以实现更高的数据访 问性能。[见K.Becker和D.D.A.Ruiz的“用于多个实际数据仓 库的聚集识别重定位算法(An Aggregate-Aware Retargeting Algorithm for Multiple Fact data Warehouse)”,在Yahiko Kambayashi 和Mukesh K.Mohania(Wolfram,编辑),DaWaK,计算机 科学讲义(Lecture Notes in Computer Science)(LNCS)第3181卷 第118-128页(Springer-Verlag,西班牙,2004年9月)。]在这种情 况下,聚集级别必须预先确定。这导致某些问题。首先,可能对没 有复制到BI系统中的信息进行查询。其次,系统可能无法为报告 产生在限定聚集级别时没有预见到的某一级别的细节。在这种情况 下,由于未完成知识库,ad-hoc报告(由用户自己创建和定制的特 定报告)并非完全可能,而只是源系统中存储的数据的经过滤的形 式。

虽然OLTP(在线事务型处理)系统存储最新的数据,由于性 能的原因,在这些系统上的有效报告仍是不可行的。OLAP(在线 分析处理)系统提供高级的报告功能,但通常不使用最新的数据: 通用报告体系结构依赖于在低系统负载期间以批量作业的方式将 OLTP数据复制到读-优化的数据结构中的复杂的、资源密集型ETL (抽取,转换和加载)处理。

发明内容

本发明的实施例涉及执行处理事务型和报告型数据库信息的 计算机程序的计算机系统以及相应的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈索-普拉特纳-研究所软件系统有限责任公司,未经哈索-普拉特纳-研究所软件系统有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200880108120.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top