[发明专利]一种数据格式转换方法、装置、设备及可读存储介质有效
申请号: | 201910712544.3 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110515894B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 王超辉 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/182 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据格式 转换 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种数据格式转换方法,应用于HDFS分布式文件系统,包括:获取用户通过人机交互界面输入的源数据的源路径,以及目的数据的目的路径和目的格式;按照源路径读取源数据,并确定源数据的源格式;从预设的格式转换器中调用与源格式和目的格式匹配的格式转换程序将源数据由源格式转换为目的格式,获得目的数据;所述格式转换器中存储有多种格式转换程序;按照目的路径存储目的数据。本申请针对任意需转换的源数据,均可按照用户在人机交互界面设定好的参数自动完成数据格式转换,从而提高了转换效率,也具备良好的通用性。相应地,本申请公开的一种数据格式转换装置、设备及可读存储介质,也同样具有上述技术效果。
技术领域
本申请涉及计算机技术领域,特别涉及一种数据格式转换方法、装置、设备及可读存储介质。
背景技术
在HDFS分布式文件系统中,为了使不同数据具有相同的格式,需要对数据进行格式转换。具体为:开发人员根据源数据的格式和需要转换的目的格式编写转换程序,进而利用该程序将源数据转换为目的格式,根据此方法就可以将不同数据都转换为统一的目的格式,从而可便于对数据进行读取等操作。但是,由于HDFS分布式文件系统中的数据量比较大,若按照上述转换方式转换数据格式,将增加开发人员的工作量,也会降低数据格式转换效率。
因此,如何提高数据格式转换效率,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种数据格式转换方法、装置、设备及可读存储介质,以提高数据格式转换效率。其具体方案如下:
第一方面,本申请提供了一种数据格式转换方法,应用于HDFS分布式文件系统,包括:
获取用户通过人机交互界面输入的源数据的源路径,以及目的数据的目的路径和目的格式;
按照源路径读取源数据,并确定源数据的源格式;
从预设的格式转换器中调用与源格式和目的格式匹配的格式转换程序将源数据由源格式转换为目的格式,获得目的数据;所述格式转换器中存储有多种格式转换程序;
按照目的路径存储目的数据。
优选地,获取用户通过人机交互界面输入的源数据的源路径,包括:
获取用户通过人机交互界面输入的多个源数据的源路径。
优选地,获取用户通过人机交互界面输入的多个源数据的源路径,包括:
获取用户通过人机交互界面输入的源数据的不完整源路径;
利用正则匹配方式查找与不完整源路径对应的所有完整源路径,并将所有完整源路径确定为源路径。
优选地,按照目的路径存储目的数据之后,还包括:
获取用户输入的删除指令,并根据删除指令删除源数据。
优选地,按照目的路径存储目的数据之后,还包括:
将源路径,目的路径和目的格式存储至历史参数记录表。
优选地,按照目的路径存储目的数据之后,还包括:
调用与目的格式对应的数据读取程序读取目的数据。
优选地,还包括:
记录源数据的格式转换日志。
第二方面,本申请提供了一种数据格式转换装置,应用于HDFS分布式文件系统,包括:
获取模块,用于获取用户通过人机交互界面输入的源数据的源路径,以及目的数据的目的路径和目的格式;
读取模块,用于按照源路径读取源数据,并确定源数据的源格式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910712544.3/2.html,转载请声明来源钻瓜专利网。