[发明专利]用于联邦学习和隐私计算的参数计算装置、系统及方法有效
申请号: | 202111198522.3 | 申请日: | 2021-10-14 |
公开(公告)号: | CN114021734B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 董扬辉;王玮;陈沫 | 申请(专利权)人: | 深圳致星科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/62;G06F21/60;G06F9/50;G06F7/72 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市南山区粤海街道大冲社*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 联邦 学习 隐私 计算 参数 装置 系统 方法 | ||
本申请涉及一种用于联邦学习和隐私计算的参数计算装置、系统及方法。参数计算装置包括:参数组计算单元,被配置为可被调用以便根据与当前算子模式相对应的密钥生成中间参数,以及根据中间参数分别生成用于蒙哥马利化运算的第一参数、用于平方乘计算的第二参数以及用于蒙哥马利化模乘计算的第三参数,中间参数根据密钥确定;控制单元,被配置为根据当前算子模式确定参数组计算单元的调用次数并调用该次数的参数组计算单元得到输出参数;和输出选择器,被配置为根据当前算子模式将输出参数发送给相对于参数计算装置的多个下级模块中的一个或者多个下级模块,从而协同完成当前算子模式。如此提供良好的计算速度和资源利用效率。
技术领域
本申请涉及数据安全和隐私保护技术领域,具体涉及一种用于联邦学习和隐私计算的参数计算装置、系统及方法。
背景技术
随着人工智能和大数据挖掘分析等应用领域的发展,对数据量的需求越来越大。例如训练人工智能的应用模型需要使用大量带有合适的数据标签或者特征数值的训练数据。高质量的数据往往来源于经营活动中产生和积累的应用数据。但是应用数据往往分散在不同的组织和个体手上,例如交易数据分散在各个金融机构,医疗诊断数据分散在各个医疗机构。跨行业跨领域的应用数据往往也是分散的,例如互联网领域的社交属性数据和电商交易数据往往由不同实体掌控。随着数据所有权的重要性、用户隐私和数据安全等受到更多重视,也随着法律法规对数据收集处理提出更严格的约束和要求,掌握应用数据的各个组织或个体往往不愿意或者没有合适手段进行彼此之间的合作,从而很难让各自掌握的应用数据共同发挥作用。这种数据分享和协同合作方面的困境被称之为数据孤岛现象。为了解决跨行业跨组织的数据合作难题,尤其是关键的隐私保护及数据安全的问题,提出了联邦学习的概念。联邦学习指的是拥有数据的各个参与方,在不共享受保护的隐私数据且自有数据不传递到外部的前提下,通过加密的方式交换模型相关信息从而实现协同优化联邦学习模型。其中,联邦学习根据训练数据在不同参与方之间的数据特征空间和样本空间的分布情况,可以划分为在数据特征空间重叠较大而在样本空间重叠较小的横向联邦学习,在数据特征空间重叠较小而在样本空间重叠较大的纵向联邦学习,以及在数据特征空间和样本空间均重叠较小的联邦迁移学习。
在联邦学习和隐私计算的各种应用场景中,涉及到通过各种算法实现不同的需求如加密后数据的联合训练或者密钥安全分配等,为此往往需要对大量的大位宽数据进行各种算子模式下的运算,这些算子模式包括例如密态乘法、密态加法、Diffie-Hellman(DH)算法、Paillier加密、Paillier解密、密态矩阵乘法、RSA交集以及DSA算法和ElGama算法等。不同的算子模式各自有不同的数学表达式来体现其中输入数据和参数之间的数学关系。这些给用于联邦学习和隐私计算的硬件和装置的计算性能提出了很大的挑战。为此,需要一种用于联邦学习和隐私计算的参数计算装置、系统及方法,不仅能够应对联邦学习和隐私计算的各种应用场景中各种算子模式的复杂多变的需求,而且具有良好的计算速度和资源利用效率。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳致星科技有限公司,未经深圳致星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111198522.3/2.html,转载请声明来源钻瓜专利网。