[发明专利]一种政务信息资源目录管理方法和系统在审
申请号: | 201911100656.X | 申请日: | 2019-11-12 |
公开(公告)号: | CN112860653A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 王海荣;肖万来;陈辉;姚伯祥 | 申请(专利权)人: | 中科曙光南京研究院有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/21;G06F16/27;G06F16/28;G06F16/51;G06F16/71 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;卢军峰 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 政务 信息资源 目录 管理 方法 系统 | ||
本发明公开了一种政务信息资源目录管理的方法,包括:S1.搭建基于Hadoop组件的大数据存储平台;S2.汇聚各方业务数据至大数据存储平台;S3.制定统一的资源目录元数据信息及资源目录编制规则;S4.将所述大数据存储平台从各方获得的数据库、文件和/或接口数据资源按照信资源目录元数据信息及资源目录编制规则进行填报,并通过包括审核、发布、订阅、审批及下架操作,进行信息资源目录全生命周期管理。本发明方法和系统面对海量的数据存储及数据访问和共享要求,采用基于hadoop基础框架的HDFS分布式存储技术实现海量数据的存储,将横向平行各委办局业务数据及纵向上级业务系统数据统一汇聚至大数据平台,实现政务信息资源数据的组织、梳理和编排以及全生命周期管理。
技术领域
本发明属于政务数据处理分析技术领域,具体而言,为一种政务信息资源目录管理方法和系统。
背景技术
政务信息资源涵盖政府领导下的各委员会、办公室、业务部门信息资源,数据资源总量巨大,数据存储容量可达到PB量级,数据种类繁杂,数据分散严重,数据库类型各不相同,各部门内部信息系统建设标准及数据资源目录定义和描述规则各不相同。需要一种新的技术或方法实现政务信息资源的统一定义和管理。
有鉴于此,特提出本发明。
发明内容
本发明要解决的技术问题在于克服现有技术的不足,提供一种政务信息资源目录管理方法和系统,以利于解决目前技术中现有政务信息资源各自为政,标准各不相同的情况下,数据资源难以统一管理的问题。
为解决上述技术问题,本发明采用技术方案的基本构思是:
一种政务信息资源目录管理的方法,包括如下步骤:
S1.搭建基于Hadoop组件的大数据存储平台;
S2.汇聚各方业务数据至所述大数据存储平台;
S3.制定统一的资源目录元数据信息及资源目录编制规则;
S4.将所述大数据存储平台从各方获得的数据库、文件和/或接口数据资源按照所述信资源目录元数据信息及资源目录编制规则进行填报,并通过包括审核、发布、订阅、审批及下架的操作,进行信息资源目录的全生命周期管理。
进一步的,上述的政务信息资源目录管理的方法中,步骤S1.中,使用ApacheHadoop集群管理工具Ambari搭建部署至少由分布式文件系统HDFS、并行计算模型MapReduce、数据仓库hive以及分布式协调机制Zookeeper大数据组件的大数据存储平台。
进一步的,上述的政务信息资源目录管理的方法中,步骤S2.中,包括
在各委办局配置前置机终端,在前置机部署mysql、sqlserver、oracle关系型数据库,数据接收接口服务以及数据文件接收处理服务;
将各委办局业务源数据汇聚至前置机终端,然后使用数据抽取工具将各委办局前置机终端汇聚的业务数据汇聚至大数据平台。
进一步的,上述的政务信息资源目录管理的方法中,步骤S3.中,包括
其中资源目录元数据信息包含:资源目录标识、资源中文名称、资源提供方单位、共享类型、使用要求、是否对公众开放、更新周期、所属基础库、所属主题、资源目录摘要、所属数据源、英文表名、列名、列中文名、默认值、是否为空、数据类型、长度、列健、所属表以及字段共享类型信息中的一种或几种;
资源目录编码规则依据《GBT 21063.5-2007政务信息资源标识符编码方案》进行定义。
进一步的,上述的政务信息资源目录管理的方法中,步骤S4.中,包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光南京研究院有限公司,未经中科曙光南京研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911100656.X/2.html,转载请声明来源钻瓜专利网。