[发明专利]基于区块链的模型训练方法及系统有效
申请号: | 202310335420.4 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116049680B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 左磊;张沈斌 | 申请(专利权)人: | 天聚地合(苏州)科技股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06F18/27;G06F18/22;G06F16/27;G06F16/23;G06F21/60;G06F21/62;G06N3/0475;G06N3/048;G06N3/094 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 郭美丽 |
地址: | 215000 江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区块 模型 训练 方法 系统 | ||
1.一种基于区块链的模型训练方法,其特征在于,所述方法包括:
模型拥有方在区块链上发布待训练模型的模型信息;
多个数据拥有方在所述区块链上注册其所拥有的训练数据的数据信息;
所述模型拥有方根据所述模型信息选择目标数据信息,并向每条目标数据信息对应的目标数据拥有方请求抽样验证;在抽样验证通过后,在所述区块链的智能合约中预存训练费用;
每个目标数据拥有方利用各自的目标训练数据对所述模型进行联合训练,在训练结束后将各自生成的模型参数加密存储到所述区块链中;
所述模型拥有方根据所述区块链上的模型参数生成训练后的模型;
所述智能合约将所述训练费用分配给每个目标数据拥有方;
所述向每条目标数据信息对应的目标数据拥有方请求抽样验证,包括:
所述模型拥有方向所述目标数据拥有方发送数据使用请求,所述数据使用请求中携带有目标训练数据的分布类型、数据量和数值范围;
所述目标数据拥有方根据所述数据量确定抽样次数,根据所述分布类型、所述数值范围和所述抽样次数对所述训练数据进行抽样,将得到的多个数据块确定为目标训练数据;根据所述多个数据块创建默克尔树,将所述默克尔树的根哈希上传到所述区块链上;将所述多个数据块的编号发送给所述模型拥有方;
所述模型拥有方从所述多个数据块的编号中选择目标编号,将所述目标编号发送给所述目标数据拥有方;
所述目标数据拥有方将所述目标编号对应的目标数据块和默克尔证明发送给所述模型拥有方;
所述模型拥有方验证所述目标数据块的数据分布与自身的测试集中的数据分布是否相同,验证根据所述目标数据块和所述默克尔证明生成的根哈希与所述区块链上的根哈希是否相同。
2.根据权利要求1所述的基于区块链的模型训练方法,其特征在于,当所述训练费用包括数据使用费和模型训练费时,所述智能合约将所述费用分配给每个目标数据拥有方,包括:
所述智能合约向所述模型拥有方获取所述模型的准确率;
所述智能合约获取每个目标数据拥有方的训练贡献度和其所提供的目标训练数据的数据量;
对于每个目标数据拥有方,所述智能合约根据所述数据量和数据单价计算数据使用费,根据所述准确率和所述训练贡献度计算模型训练费,将所述数据使用费和所述模型训练费相加后得到所述目标数据拥有方的应得费用,从所述训练费用抽取所述应得费用分配给所述目标数据拥有方。
3.根据权利要求2所述的基于区块链的模型训练方法,其特征在于,在所述模型拥有方根据所述区块链上的模型参数生成训练后的模型之后,所述方法还包括:
所述模型拥有方获取与所述模型对应的验证方式,所述模型为分类模型、回归模型或生成模型;
所述模型拥有方利用自身的测试集和所述验证方式计算所述模型的准确率;
所述模型拥有方将所述准确率发送给所述智能合约。
4.根据权利要求3所述的基于区块链的模型训练方法,其特征在于,所述模型拥有方利用自身的测试集和所述验证方式计算所述模型的准确率,包括:
当所述模型是分类模型时,所述模型拥有方利用所述分类模型对所述测试集进行分类,计算正确分类的数据与所有分类的数据的比值,将所述比值确定为所述分类模型的准确率;
当所述模型是回归类型时,所述模型拥有方利用所述回归模型对所述测试集的特征向量进行处理,得到预测值,计算所述预测值与所述测试集中标注的标准值之间的第一余弦相似度,将所述第一余弦相似度确定为所述回归模型的准确率;
当所述模型是生成模型时,所述模型拥有方利用所述生成模型对所述测试集的特征向量进行模拟,得到新生成数据,计算所述测试集中的数据与所述新生成数据之间的第二余弦相似度,将所述第二余弦相似度确定为所述生成模型的准确率。
5.根据权利要求2所述的基于区块链的模型训练方法,其特征在于,所述方法还包括:
所述智能合约获取每一轮训练时,每个目标数据拥有方得到的各个模型参数的梯度下降值;
所述智能合约计算每个模型参数的梯度下降值之和,将所有梯度下降值之和组成梯度下降向量;
所述智能合约根据所述梯度下降向量计算每个目标数据拥有方对所有模型参数的训练贡献度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天聚地合(苏州)科技股份有限公司,未经天聚地合(苏州)科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310335420.4/1.html,转载请声明来源钻瓜专利网。