[发明专利]一种基于区块链的机器学习数据存证方法和系统在审
申请号: | 202010816377.X | 申请日: | 2020-08-14 |
公开(公告)号: | CN112699414A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 林健;余波;罗明宇 | 申请(专利权)人: | 武汉乾云软件开发中心(有限合伙) |
主分类号: | G06F21/64 | 分类号: | G06F21/64;G06F16/27;G06F16/22 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 尹均利 |
地址: | 430000 湖北省武汉市东湖新技术开发区金*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区块 机器 学习 数据 方法 系统 | ||
本发明公开一种基于区块链的机器学习数据存证方法和系统,区块链的网络下第一节点对机器学习相关的数据进行处理,获得机器学习的模型训练过程的中间数据的过程采样数据,获得机器学习相关的数据相应的摘要信息;摘要信息包括训练摘要信息、过程摘要信息、以及测试摘要信息,过程摘要信息基于过程采样数据生成,利用过程摘要信息建立机器学习的模型的训练过程与测试过程之间的关联,该关联可增强数据存证的说服力;将这些摘要信息作为机器学习数据保存至区块链的网络;由区块链的网络下第二节点使用预设摘要操作方式对第一节点的机器学习数据验证。对机器学习研究成果所涉及的各项机器学习数据进行存证,提升研究成果的可信度和可复现性。
技术领域
本发明涉及区块链技术领域,尤其涉及一种基于区块链的机器学习数据存证方法和系统。
背景技术
近年来,随着人工智能技术的高速发展,关于机器学习(包括深度学习、强化学习等)的学术研究变得非常热门。本领域的学术会议和期刊层出不穷,相关研究论文数量也呈快速增长趋势。在不断涌现的研究成果中,难免出现鱼龙混杂的情况。不少研究成果已被学术机构或读者指出存在数据造假、无法复现等问题。为了对论文成果的真实性加以确实,已有若干学术会议和期刊要求作者提供并公开论文相关的源代码、数据集等原始资料,以便评审者或读者进行验证或复现。这类要求旨在规范作者的投稿行为,在一定程度上防止学术造假,从而有助于确保研究成果的质量和真实性。
不过,现有的这类要求仍属于一种君子协定,其有效性取决于被验证人的自觉性与操作的规范性。一方面,基于传统技术公开研究成果的原始资料时,普遍存在完整性和不可抵赖性难以保证的问题。另一方面,基于被验证人手工提交原始资料的方式难免出现错误和疏漏,从而对事后可能的验证带来困难。此外,现有的机制只能要求被验证人提交源代码、数据集这类相对静态的数据,却不能反映出机器学习模型训练的动态过程中的信息。由于模型训练过程本身存在一定的随机因素,这些信息如果不能被存证,就会对事后验证带来困扰,从而降低验证结果的有效性。
区块链技术因具有数据篡改代价极大的特性,因而经常被用于实现存证或公证系统。然而,现有的区块链存证或公证系统均没有为机器学习数据存证的特点专门设计。无论概念还是实践,现有系统均难以直接满足在机器学习场景应用的需求。
发明内容
本发明针对这以上技术问题,提出一种基于区块链的机器学习数据存证方法与系统,能够有效地解决机器学习场景对数据存证的需求。
所述区块链的网络至少包括第一节点和第二节点,所述基于区块链的机器学习数据存证方法包括:
所述第一节点按照预设摘要操作方式对机器学习相关的数据进行处理,获得所述机器学习的模型训练过程的中间数据的过程采样数据,并获得所述机器学习相关的数据相应的摘要信息;所述摘要信息包括训练摘要信息、过程摘要信息、以及测试摘要信息,其中,所述过程摘要信息基于所述过程采样数据生成,利用所述过程摘要信息建立所述机器学习的模型的训练过程与测试过程之间的关联;
所述第一节点将所述摘要信息作为预存摘要信息写入目标区块链交易,并生成与所述目标区块链交易相应的区块链交易标识;并将所述区块链交易提交到所述区块链的网络;
所述第一节点在所述第二节点发起验证请求时,向所述第二节点提供所述区块链交易标识和所述机器学习相关的数据;
所述第二节点根据所述区块链交易标识从所述区块链的网络中获取目标区块链交易;
所述第二节点从所述目标区块链交易提取所述预存摘要信息,所述预存摘要信息包括预存训练摘要信息、预存过程摘要信息、以及预存测试摘要信息;
所述第二节点按照所述预设摘要操作方式重新对所述第一节点提供的机器学习相关的数据进行处理,得到待验证摘要信息,所述待验证摘要信息包括待验证训练摘要信息、待验证过程摘要信息、以及待验证测试摘要信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉乾云软件开发中心(有限合伙),未经武汉乾云软件开发中心(有限合伙)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010816377.X/2.html,转载请声明来源钻瓜专利网。