[发明专利]将文档型数据库的数据转换至关系型数据库的方法及系统有效

专利信息
申请号: 201410187061.3 申请日: 2014-05-05
公开(公告)号: CN103955517B 公开(公告)日: 2017-05-03
发明(设计)人: 陈旻炜;陈建军;舒文宇 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司11127 代理人: 汤在彦
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文档 数据库 数据 转换 关系 方法 系统
【说明书】:

技术领域

发明关于计算机数据处理技术领域,特别是关于不同数据库之间的数据迁移技术,具体的讲是一种将文档型数据库的将文档型数据库的数据转换至关系型数据库至关系型数据库的方法及系统。

背景技术

随着计算机技术的日益发展,原本基于文档型数据库开发的应用系统越来越多的需要迁移到主流的浏览器B/服务器模式S平台应用系统。如何实现将文档型数据库中的老数据迁移到B/S平台的关系型数据库中,并同时满足B/S平台新系统的要求呢?

传统的数据信息获取和转换方式是通过后台数据逻辑变换实现的,即通过文档型数据库的客户端导出程序,文档型数据库中按移行要素遍历和逻辑计算后,下载数据至导出客户端本地,下载的数据包括文字信息和实体文件。

上述传统的数据获取和转换方式在数据移行中存在的弊端主要包括:

1、移行程序开发成本高,复用率低。在文档型数据库中存放的是非结构化的文档,而用户看到的信息是显示时应用系统计算得出的,因此为满足移行要求,导出程序在导出的同时需要对数据进行逻辑计算,所以对于导出方,必须对应用系统的后台数据结构有深入了解,定制化开发成本高,移行程序复用率低;

2、移行效率低。文档型数据库的查询效率低,尤其是在高并发情况下查询效率急剧下降,大大限制了移行效率的提高。

因此,如何实现将文档型数据库中的老数据迁移到B/S平台的关系型数据库中,既能满足B/S平台新系统的要求,又能克服移行工具开发成本高、复用率低、移行效率低的问题是本领域亟待解决的技术难题。

发明内容

为了克服现有技术中文档型数据库向关系型数据库数据移行工具开发成本高、复用率低,移行效率低的问题,本发明提供了一种将文档型数据库的数据转换至关系型数据库的方法及系统,将文档型数据库的数据以HTML文件的形式保存,对于HTML文件的数据,采取标签匹配方式逐行进行字符级匹配截取,最后将转换处理后的数据导入关系型数据库,来实现文档型数据库向关系型数据库的高效数据移行。

本发明的目的之一是,提供一种将文档型数据库的数据转换至关系型数据库的方法,包括:采集地址参数、用户身份参数以及导出参数;采集用户输入的启动请求;根据所述的启动请求、地址参数以及用户身份参数抓取文档型数据库的数据,得到超文本标记语言HTML文件;根据标签匹配方式对所述的HTML文件进行转换,得到文本文件;根据所述的导出参数将所述的文本文件中的数据导入至关系型数据库中。

本发明的目的之一是,提供了一种将文档型数据库的数据转换至关系型数据库的系统,所述的系统具体包括采集装置,用于采集地址参数、用户身份参数以及导出参数,采集用户输入的启动请求;数据抓取装置,用于根据所述的启动请求、地址参数以及用户身份参数抓取文档型数据库的数据,得到超文本标记语言HTML文件;数据转换装置,用于根据标签匹配方式对所述的HTML文件进行转换,得到文本文件;数据导入装置,用于根据所述的导出参数将所述的文本文件中的数据导入至关系型数据库中。

本发明的有益效果在于,提供了一种将文档型数据库的数据转换至关系型数据库的方法及系统,将文档型数据库的数据以HTML文件的形式保存,对于HTML文件的数据,采取标签匹配方式逐行进行字符级匹配截取,最后将转换处理后的数据导入关系型数据库,来实现文档型数据库向关系型数据库的数据移行,由此降低移行程序的开发成本,提高移行效率。

为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种将文档型数据库的数据转换至关系型数据库的方法的流程图;

图2为图1中的步骤S103的具体流程图;

图3为图1中的步骤S104的具体流程图;

图4为图1中的步骤S105的具体流程图;

图5为本发明实施例提供的一种将文档型数据库的数据转换至关系型数据库的系统的结构框图;

图6为本发明实施例提供的一种将文档型数据库的数据转换至关系型数据库的系统中数据抓取装置200的结构框图;

图7为本发明实施例提供的一种将文档型数据库的数据转换至关系型数据库的系统中数据转换装置300的结构框图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410187061.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top