[发明专利]一种基于ETL工具的资源描述框架数据转换存储一体化方法在审
申请号: | 201910510063.4 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110222110A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 孙坦;鲜国建;赵瑞雪;李娇;黄永文;寇远涛 | 申请(专利权)人: | 中国农业科学院农业信息研究所 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据转换 资源描述框架 命名空间 转换数据 存储 预处理 存储目标位置 关系型数据库 数据处理效率 数据转换过程 资源调度效率 关系型数据 数据库添加 存储操作 脚本添加 可扩展性 人工成本 设置存储 输出格式 属性映射 映射规则 字段信息 字段转换 连贯性 一体化 源数据 中结构 主语 字段 转换 | ||
1.一种对现有ETL工具映射规则及图数据存储模式的改造方法,其特征在于:所述方法包括:
步骤1.在ETL工具代码层定义RDB中表、列、行分别映射到RDF中类、属性、资源的转换规则,并对其进行功能封装;
步骤2.设计ETL工具的RDF数据混合存储模式,可选择本地或图数据库存储,或者两者同时存储,并对其进行功能封装。
2.根据权利要求1所述的改造方法,其特征在于:所述步骤1中的RDB映射到RDF中的转换规则,定义为:RDB.表->RDF.类、RDB.列->RDF.属性、RDB.行->RDF.资源,其中,任意一条实例数据都可指定多个类。
3.一种基于ETL工具的资源描述框架数据转换存储一体化方法,其特征在于:所述存储一体化方法包括:
步骤1.关系型数据预处理,通过数据库添加唯一键值,作为数据转换过程中的资源名;
步骤2.获取关系型数据库中结构化数据的字段信息,确定待转换数据的必备字段;
步骤3.针对数据转换脚本添加RDF输出格式形成完整程序;
步骤4.根据待转换数据的类型确定命名空间及命名空间前缀,限定变量定义范围;
步骤5.设置主语及实例映射规则,将获取的源数据字段对应转换为HttpURI;
步骤6.设置属性映射规则,包括:获取的源字段、对象属性、数据属性、对象及谓语实例URI、多值分隔符、数据类型;
步骤7.设置存储格式及存储目标位置,执行转换及存储操作。
4.根据权利要求3所述的存储一体化方法,其特征在于:所述步骤2具体为:在ETL工具中添加数据转换脚本,输入连接到源数据库,即存储待转换数据表的关系型数据库,通过SQL查询给出源数据表中所有字段,根据预构建的语义模型选定并获取数据表中待转换的必备字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业信息研究所,未经中国农业科学院农业信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910510063.4/1.html,转载请声明来源钻瓜专利网。