[发明专利]一种企业异构数据分类编码集成交换与管理的方法及装置在审
申请号: | 201410325216.5 | 申请日: | 2014-07-09 |
公开(公告)号: | CN104111998A | 公开(公告)日: | 2014-10-22 |
发明(设计)人: | 井福荣;古发辉 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 341000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 数据 分类 编码 集成 交换 管理 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及一种企业异构数据分类编码集成交换与管理的方法及装置。
背景技术
随着计算机技术和网络技术的迅猛发展,大部分企业在信息化进程中,在不同时期,由不同的公司针对企业各部门不同的业务需求建设有大量的各种各样的应用信息系统,同时积累了大量数据资源。这些资源被视作与人力资源、物资资源和资金资源同等重要的战略资源,然而这些资源没能得到很好地利用和开发,企业之间甚至企业内部的数据资源无法共享、交换。
其主要原因是由于企业内部各部门的职能和业务多种多样,信息化水平参差不齐,开始的信息化建设常常只考虑本身的业务需求而进行系统开发,导致了这些数据资源具有明显的分布性、自治性和异构性等特点,并以不同形式存储的、依赖于不同数据库管理系统。因此,如何解决企业内部及企业之间的信息共享、交换及对分布、异构的数据进行统一集中管理成为企业提升自身综合竞争力的一个急需解决的问题。
异构数据集成技术通过解决企业多平台、多应用、多结构、多语义数据的集成,不仅可以把企业内部的各种相关数据资源进行整合,而且可以收集企业外部相关信息,为企业的决策提供支持。针对上述问题,国内外提出了各种各样的异构数据集成解决方案,概括起来主要有多数据库系统集成方法、联邦数据库集成方法、中间件集成方法、数据仓库集成方法、基于XML技术集成方法、基于网格的异构集成方法这六种集成方法。然而这些解决方案中均没有从根源上(统一企业异构数据分类编码)来考虑,从而严重制约企业异构数据集成与交换效果,企业数据不一致、数据语义冲突、数据大量冗余、无法集中管理和实时共享等现象依然存在。导致这一现象的主要原因是在现有异构数据集成方法中,没有一种方式是从出现异构数据根源着手(即企业异构数据缺乏统一分类编码),现有方法基本上是围绕如何实现异构数据的访问这一问题展开研究,因此集成企业很难做到集中管理所有异构数据资源,真正做到一个入口。另一方面,随着企业信息化进程的不断加快,企业对信息的需求也呈现越来越具有高效性、灵活性、广泛性、综合性和通用性等特点。
因此,一种从根源上彻底解决企业数据不一致、数据语义冲突、数据大量冗余、无法集中管理和实时共享等问题的自动化程度高、投资成本低的企业异构数据共享和交换技术亟待开发。
发明内容
本发明的目的在于提供一种企业异构数据分类编码集成交换与管理的方法及装置,旨在解决企业数据不一致、数据语义冲突、数据大量冗余、无法集中管理和实时共享等问题。
本发明是这样实现的,一种企业异构数据分类编码集成交换与管理的方法,包括以下步骤:
统一异构数据标准格式的表现形式以及编写异构数据采集中间件,采集企业的远程和本地异构数据;
将采集的异构数据按照不同模式、不同主题属性子进行聚类,通过聚类形成可供分类的主题属性子以及模式,根据分类约束对聚类形成的可供分类的主题属性子以及模式进行模式重组,选择一种带约束的模式对聚类形成的主题数据进行分类,导出智能化异构数据的分类规则;
在企业原有信息系统上,采用接口转换的方式将原有编码转换成新编码,逐步过渡到新的编码体系;
构建基于统一服务接口的异构数据共享和交换机制。
优选地,所述统一异构数据标准格式的表现形式以及编写异构数据采集中间件,采集企业的远程和本地异构数据包括以下步骤:
建立主题树模型,通过主题树模型采集结构化、半结构化以及非结构化的异构数据,并将采集的异构数据的结构模式上的异构性进行消除和屏蔽,统一异构数据集成的格式;
基于主题树模型将异构数据映射到最终的统一标准格式XML scheme上;
建立异构数据采集中间件模型,通过异构数据采集中间件模型,采集企业异构数据,其具体做法为:按结构化、半结构化以及非结构化三种类型异构数据分别建立结构化、半结构化以及非结构化异构数据采集中间件,从本地和远程异构数据进行采集:对于结构化异构数据,采用JDBC数据连接到各种不同环境、不同类型的数据库中,通过数据库操作,提取相关数据,再通过主题树模型进行表示;对于半结构化异构数据,若是存放在数据库中的则按照结构化数据采集方式,若是XML文档,转换成XML DOM,并在其中封装各种数据操作,然后再通过主题树模型进行表示;对于非结构化异构数据,通过封装对文件的各种属性操作,将非结构化数据结构化表示成主题树,再映射为XML Scheme文档。
优选地,所述在企业原有信息系统上,采用接口转换的方式将原有编码转换成新编码,逐步过渡到新的编码体系包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410325216.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置