[发明专利]裁判文书处理模型的训练方法、训练装置和电子设备有效
申请号: | 202010408720.7 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111553443B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 李东海;郭晓妮;侯晓焱;黄晓宏;刘亚会 | 申请(专利权)人: | 北京华宇元典信息服务有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L29/06;G06F16/31;G06N20/00 |
代理公司: | 北京唐颂永信知识产权代理有限公司 11755 | 代理人: | 匡霖 |
地址: | 100080 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 裁判 文书 处理 模型 训练 方法 装置 电子设备 | ||
1.一种裁判文书处理模型的训练方法,应用于第一客户端,其特征在于,包括:
将位于所述第一客户端的加密的第一裁判文书数据集与位于第二客户端的加密的第二裁判文书数据集对齐;
从所述第二客户端接收加密的用于计算梯度的中间结果;
以所述第一裁判文书数据集和所述中间结果训练位于所述第一客户端的裁判文书处理模型,以获得用于模型更新的本地参数,包括:以所述中间结果对位于所述第一客户端的裁判文书处理模型进行梯度计算,以获得加密的梯度计算结果;以及以所述第一裁判文书数据集的标签数据对位于所述第一客户端的裁判文书处理模型进行损失计算,以获得损失计算结果;
将所述本地参数以服务器端提供的密钥进行加密并发送到服务器端;
从所述服务器端接收基于多个客户端的本地参数汇总的集合参数,其中,所述集合参数通过位于所述服务器的参数聚合模型聚合来自多个客户端的损失计算结果和梯度计算结果获得;以及
基于所述集合参数更新所述裁判文书处理模型。
2.根据权利要求1所述的训练方法,其中,在将位于所述第一客户端的加密的第一裁判文书数据集与位于第二客户端的加密的第二裁判文书数据集对齐之前,还包括:
以所述第一裁判文书数据集训练位于所述第一客户端的裁判文书处理模型,以获得所述裁判文书处理模型的初始模型参数。
3.根据权利要求1所述的训练方法,其中,将所述本地参数以服务器端提供的密钥进行加密并发送到服务器端,包括:
以服务器提供的公钥对所述本地参数进行加密。
4.根据权利要求1-3任一所述的训练方法,其中,加密技术选自RSA加密、Gramer-Shoup、Elgamal和椭圆曲线加密中任意一种。
5.根据权利要求1-3任一所述的训练方法,其中,所述裁判文书处理模型用于识别裁判文书中的敏感信息。
6.一种裁判文书处理模型的训练方法,应用于服务器端,其特征在于,包括:
接收来自多个客户端的用于模型更新的本地参数;
以参数聚合模型聚合所述多个客户端的用于模型更新的本地参数,以获得集合参数;以及
传输所述集合参数至所述多个客户端,其中,所述集合参数用于更新位于各个客户端的裁判文书处理模型;
其中,所述参数聚合模型的训练过程,包括:
接收所述多个客户端中第一子集的用于模型更新的本地参数;
接收所述多个客户端中第二子集的用于模型更新的本地参数;
以所述第一子集的用于模型更新的本地参数训练所述参数聚合模型;以及
以所述第二子集的用于模型更新的本地参数进一步训练经由所述第一子集的用于模型更新的本地参数训练后的所述参数聚合模型;
所述第一子集的用于模型更新的本地参数对所述参数聚合模型的影响权重与所述第二子集的用于模型更新的本地参数对所述参数聚合模型的影响权重相一致。
7.根据权利要求6所述的训练方法,其中,在接收来自多个客户端的用于模型更新的本地参数之前,进一步包括:
传输用于加密的公钥至所述多个客户端,所述多个客户端基于所述公钥对用于模型更新的本地参数进行加密。
8.根据权利要求7所述的训练方法,其中,在传输所述集合参数至所述多个客户端之前,还包括:
基于与所述公钥匹配的私钥对所述集合参数进行解密。
9.根据权利要求7至8任一所述的训练方法,其中,加密技术选自RSA加密、Gramer-Shoup、Elgamal和椭圆曲线加密中任意一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇元典信息服务有限公司,未经北京华宇元典信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010408720.7/1.html,转载请声明来源钻瓜专利网。