[发明专利]一种JSON数据的结构化解析方法及装置在审
申请号: | 201710138525.5 | 申请日: | 2017-03-09 |
公开(公告)号: | CN106934011A | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 李云超 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 李世喆 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 json 数据 结构 化解 方法 装置 | ||
技术领域
本发明涉及数据处理技术领域,特别涉及一种JSON数据的结构化解析方法及装置。
背景技术
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,JSON数据属于半结构化数据,数据结构比较松散,可以存储比较复杂的数据类型,因此JSON被广泛应用于MongoDB(基于分布式文件存储的数据库)等数据库,以代替关系型数据库来存储高并发读写的数据。在对海量数据进行有针对性的挖掘分析时,有时需要对JSON数据进行结构化解析,将JSON数据转换为结构化数据,以便数据挖掘分析。
目前,在对JSON数据进行结构化解析时,主要通过人工解析的方式,将各条JSON数据整合到数据表中,形成结构化数据。
针对于现有JSON数据的结构化解析方法,通过人工逐条解析的方式对JSON数据进行解析,当JSON数据的数据量较大时,需要耗费大量时间才能够完成JSON数据的结构化解析,造成对JSON数据进行结构化解析的效率较低。
发明内容
本发明实施例提供了一种JSON数据的结构化解析方法及装置,能够提高对JSON数据进行结构化解析的效率。
第一方面,本发明实施例提供了一种JSON数据的结构化解析方法,包括:
对至少一条JSON数据的文档对象进行结构化解析,形成结构化文档数据;
对所述至少一条JSON数据的数组对象进行结构化解析,形成结构化数组数据;
根据外部输入的关键字段,将所述结构化文档数据与所述结构化数组数据关联合并,形成结构化输出数据;
创建所述结构化输出数据中字段与外部关系型数据库中字段之间的字段映射关系;
根据所述字段映射关系,将所述结构化输出数据导入所述外部关系型数据库。
优选地,
在所述根据外部输入的关键字段将所述结构化文档数据与所述结构化数组数据关联合并之前,进一步包括:
通过Java数据库连接JDBC连接器连接存储有所述至少一条JSON数据的非关系型数据库;
通过所述JDBC连接器对所述至少一条JSON数据进行预览;
接收外部根据所预览的所述至少一条JSON数据而输入的所述关键字段。
优选地,
所述根据外部输入的关键字段将所述结构化文档数据与所述结构化数组数据关联合并,包括:
针对于所述结构化文档数据包括的任意一条第一数据,获取所述第一数据中位于所述关键字段下的关键数据;
从所述结构化数组数据中获取一条第二数据,其中所述第二数据中位于所述关键字段下的数据与所述关键数据相同;
将所述第一数据与第二数据进行关联合并。
优选地,
在所述形成结构化文档数据之后,进一步包括:
对所述结构化文档数据进行预览。
优选地
在所述形成结构化数组数据之后,进一步包括:
对所述结构化数组数据进行预览。
优选地,
所述根据所述字段映射关系将所述结构化输出数据导入所述外部关系型数据库,包括:
针对于所述结构化输出数据中的任意一个第一字段,根据所述字段映射关系,确定所述外部关系型数据库中与所述第一字段相映射的第二字段;
将所述结构化输出数据中位于所述第一字段下的数据导入到所述外部关系型数据库中所述第二字段下。
第二方面,本发明实施例还提供了一种JSON数据的结构化解析装置,包括:解析单元、合并单元、映射单元及导入单元;
所述解析单元,用于对至少一条JSON数据的文档对象进行结构化解析,形成结构化文档数据;以及对所述至少一条JSON数据的数组对象进行结构化解析,形成结构化数组数据;
所述合并单元,用于根据外部输入的关键字段,将所述解析单元形成的所述结构化文档数据与所述结构化数组数据关联合并,形成结构化输出数据;
所述映射单元,用于创建所述合并单元所形成的所述结构化输出数据中字段与外部关系型数据中字段之间的字段映射关系;
所述导入单元,用于根据所述映射单元创建的所述字段映射关系,将所述合并单元形成的所述结构化输出数据导入所述外部关系型数据库。
优选地,
该装置进一步包括:预览单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710138525.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动查重方法及装置
- 下一篇:一种基于知识图谱的自然语言问答实现方法和系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置