[发明专利]基于Spark和区块链的数据处理系统在审
申请号: | 201811551575.7 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109657008A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 张延华;杨硕鹏;于非;王勇;杨兆鑫;杨睿哲;吴文君;王道魁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/2458 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中枢数据 区块 数据处理模块 数据上传模块 数据应用模块 数据处理系统 原始数据 存储原始数据 机器学习算法 数据模块 系统架构 子节点 调用 挖掘 返回 应用 | ||
1.基于Spark和区块链的数据处理系统,其特征在于:
整个系统由数据上传模块、数据处理模块、中枢数据模块、数据应用模块这四个部分组成;整个系统架构建立在区块链上,数据上传模块、数据处理模块皆为区块链的一个子节点,中枢数据模块存储该系统所有数据,并与其他各个模块连接以完成数据的流通,中枢数据模块为整个系统的核心;
所述的数据上传模块用于将原始数据A上传到中枢数据模块,包括原始数据A的上传接口文件,其中上传接口文件通过web3接口调用智能合约中的数据上传函数完成数据的上传;
所述的数据处理模块采用基于Spark平台的机器学习算法,用于训练中枢数据模块中的原始数据A以得到训练后的数据B,并将B返回至中枢数据模块;具体包括取数据的接口文件、spark数据训练模块、上传处理后数据B的接口文件,
其中取数据的接口文件用于从中枢数据模块获得原始数据A并传给spark数据训练模块,取数据的接口文件通过web3接口调用智能合约中的数据下载函数实现数据下载功能;
其中spark数据训练模块包括数据处理、训练模型、使用模型三部分,数据处理用于对原始数据A进行标准化,然后对选择的模型进行训练,接下来使用训练好的模型对标准化后的数据进行训练并得到数据B;
其中上传处理后数据B的接口文件用于将数据B上传至中枢数据模块,该文件所包括信息及所实现功能与数据上传模块中的上传接口文件相同;
所述的数据应用模块用于从中枢数据模块中取得B并应用;
所述的中枢数据模块用于存储原始数据以及处理后的数据,并接受数据上传模块、数据处理模块、以及数据应用模块的调用,具体包括区块链数据系统和智能合约,
其中区块链数据系统用于存储数据A、B,
其中智能合约用于实现数据上传功能、数据下载功能,包括规定数据结构的结构体、数据上传函数、数据下载函数。
2.根据权利要求1所述的基于Spark和区块链的数据处理系统,其特征在于:所述的spark数据训练模块可以采用最小二乘模型、线性回归模型、决策树、支持向量机进行数据训练。
3.根据权利要求1所述的基于Spark和区块链的数据处理系统,其特征在于:
所述的数据应用模块使用基于以太坊平台所搭建的去中心化应用DApp完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811551575.7/1.html,转载请声明来源钻瓜专利网。