[发明专利]用于在跨网络的大数据平台之间转移文件的方法和系统有效
申请号: | 201911346825.8 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111182047B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王琪;何东杰 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | H04L67/563 | 分类号: | H04L67/563;H04L67/5651;H04L67/06 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 童剑雄 |
地址: | 201203 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 网络 数据 平台 之间 转移 文件 方法 系统 | ||
本发明提供一种用于在跨网络的大数据平台之间转移文件的方法,包括:从第一大数据平台提取所述文件;生成与所述文件对应的文件信息并将所述文件划分成具有预定长度的至少一个数据段;通过数据发送端、经由所述网络发送所述至少一个数据段和所述文件信息;通过数据接收端、经由所述网络接收所述至少一个数据段和所述文件信息,并将所述至少一个数据段和所述文件信息写入分布式消息队列;以及根据所述分布式消息队列中的所述文件信息解析所述分布式消息队列中的所述至少一个数据段,将所述至少一个数据段还原成所述文件,并将所述文件写入第二大数据平台。
技术领域
本发明涉及大数据领域,尤其涉及一种跨大数据平台的转移文件的方法和系统。
背景技术
在应用大数据技术的场景中,存在将大量文件从一个大数据平台转移到另一个大数据平台的需求。在本文中,术语“文件”指非结构化数据。本领域中,非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,且不方便用数据库二维逻辑表来表现的数据。非结构化数据包括具有各种格式的办公文档(例如,文本、图片、XML,、HTML、报表、图像和音频/视频等)以及具有不同压缩格式的数据(例如,文本、parquet、RCFile、OrcFile等)。
针对上述需求,现有的方案包括拷贝文件(例如借助FTP的方式)或将文件进行解析后再通过开源组件传输。拷贝文件的方案需要同时占用发送端和接收端的资源,导致难以实现一对多或多对一的文件转移;而将文件进行解析后再通过开源组件传输的方案需要占用大量的计算资源,并且针对不通格式的文件需要使用不同的组件,无法做到自适应。
发明内容
本发明的一个方面公开了一种用于在跨网络的大数据平台之间转移文件的方法,包括:从第一大数据平台提取所述文件;生成与所述文件对应的文件信息并将所述文件划分成具有预定长度的至少一个数据段;通过数据发送端、经由所述网络发送所述至少一个数据段和所述文件信息;通过数据接收端、经由所述网络接收所述至少一个数据段和所述文件信息,并将所述至少一个数据段和所述文件信息写入分布式消息队列;以及根据所述分布式消息队列中的所述文件信息解析所述分布式消息队列中的所述至少一个数据段,将所述至少一个数据段还原成所述文件,并将所述文件写入第二大数据平台。
本发明的另一个方面公开了一种用于在跨网络的大数据平台之间转移文件的系统,包括:数据发送端,其用于从第一大数据平台提取所述文件,生成与所述文件对应的文件信息并将所述文件划分成具有预定长度的至少一个数据段,并且通过网络发送所述至少一个数据段和所述文件信息;以及数据接收端,其用于通过所述网络接收所述至少一个数据段和所述文件信息,将所述至少一个数据段和所述文件信息写入分布式消息队列,并且根据所述分布式消息队列中的所述文件信息解析所述至少一个数据段,以便将所述至少一个数据段还原成所述文件,从而将所述文件写入第二大数据平台。
本发明的又一个方面提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令被计算机执行时能够执行根据本发明的实施例所述的方法
本发明的实施例能够实现文件的异步转移,即可以在原大数据平台空闲的时候进行发送,目标大数据平台在空闲的时候再接收,不会同时占用两个数据平台的计算资源,从而节省了计算资源。
由于本发明的实施例能够传输字节形式的数据,因此不管是压缩文件、图片文件、或是大数据专有格式文件都可以发送,不需要额外开发用于转移不同文件的不同组件,从而实现文件转移的自适应。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911346825.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置