[发明专利]基于状态转移核优化的数据处理方法、装置、设备及介质在审
申请号: | 202110115051.9 | 申请日: | 2021-01-27 |
公开(公告)号: | CN113158223A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 姜迪 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q40/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 状态 转移 优化 数据处理 方法 装置 设备 介质 | ||
1.一种基于状态转移核优化的数据处理方法,其特征在于,应用于第一参与方,所述第一参与方与第二参与方进行联邦通信连接,所述基于状态转移核优化的数据处理方法包括:
在第一参与方每次训练本地模型参数的过程中,根据所述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地模型参数的组合状态信息;
根据所述组合状态信息,确定待联邦的目标模型参数;
基于所述待联邦的目标模型参数,与各个第二参与方进行联邦训练,得到所述第一参与方的预设预测模型。
2.如权利要求1所述的基于状态转移核优化的数据处理方法,其特征在于,所述在第一参与方每次训练本地模型参数的过程中,根据所述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地模型参数的组合状态信息的步骤,包括:
在第一参与方每次训练本地模型参数的过程中,根据所述第一参与方的资源属性信息确定内存消耗上限;
根据所述内存消耗上限以及预设采样消耗计算规则,动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定第一参与方所有预设本地模型参数的组合状态信息。
3.如权利要求2所述的基于状态转移核优化的数据处理方法,其特征在于,所述根据所述内存消耗上限以及预设采样消耗计算规则,动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定第一参与方所有预设本地模型参数的组合状态信息的步骤,包括:
分别确定各个预设本地模型参数的子内存消耗上限;
确定每个预设本地模型参数的类型与数量,根据所述子内存消耗上限,所述预设采样消耗计算规则以及所述状态类型与数量,通过遍历方式确定预设本地样本数据的状态采样算法;
确定每个预设本地模型参数在对应所述状态采样算法下的最小状态转移路线;
根据所述状态采样算法以及所述最小状态转移路线,得到预设本地样本数据的识别状态,以确定第一参与方所有预设本地模型参数的组合状态信息。
4.如权利要求3所述的基于状态转移核优化的数据处理方法,其特征在于,所述分别确定各个预设本地模型参数的子内存消耗上限的步骤,包括:
确定各个预设本地模型参数对模型训练结果的影响程度;
根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限。
5.如权利要求2所述的基于状态转移核优化的数据处理方法,其特征在于,在动态确定预设本地样本数据的状态采样算法的过程中,还根据所述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样中间参数。
6.如权利要求1所述的基于状态转移核优化的数据处理方法,其特征在于,所述基于所述待联邦的第一模型参数,与各个第二参与方进行联邦训练,得到所述第一参与方的预设预测模型的步骤,包括:
基于所述待联邦的第一模型参数,通过执行预设联邦流程,与各个第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数,以基于所述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的替换更新的模型参数;
继续动态确定所述替换更新后的所述模型参数的状态采样算法,以继续确定待联邦的第一参与方的其他模型参数,并不断进行迭代训练,直至达到预设训练完成条件,得到预设预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110115051.9/1.html,转载请声明来源钻瓜专利网。