[发明专利]数据模型训练方法和装置有效
申请号: | 201810256461.3 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108520181B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 石佩林;王晓勇 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06N20/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 训练 方法 装置 | ||
本公开提供了一种数据模型训练方法,包括:获取训练集,所获取的该训练集中包括多条训练数据,对该训练集进行第一隐私保护处理,得到加密训练集。使用该加密训练集对数据模型进行训练,得到模型参数。对所得到的模型参数进行第二隐私保护处理,得到加密模型参数,基于该加密模型参数生成加密数据模型。其中,第一隐私保护处理使得加密训练集不同于训练集、且加密训练集与训练集的训练结果相同;第二隐私保护处理使得加密模型参数不同于模型参数,且基于加密模型参数生成的加密数据模型与基于模型参数生成的数据模型在输入相同时具有相同的输出结果。本公开还提供了一种数据模型训练装置、以及一种计算机设备。
技术领域
本公开涉及一种数据模型训练方法和装置。
背景技术
近年来,人工智能强制崛起,人们领略到了人工智能技术的巨大潜力,人工智能技术中,数据是载体,智能是目标,而机器学习是从数据通往智能的技术途径。机器学习的本质是计算机利用已有的数据训练出某种数据模型,并利用此数据模型进行预测的过程。
在实现本公开构思的过程中,发明人发现现有技术基于机器学习或深度学习进行数据模型训练的过程中,训练数据以及训练结束后得到的模型参数往往是公开的,处于攻击者想获取便可获取的不安全状态,很容易被攻击者恶意利用。
发明内容
本公开的一个方面提供了一种数据模型训练方法,包括:获取训练集,所获取的该训练集中包括多条训练数据,对该训练集进行第一隐私保护处理,得到加密训练集。使用该加密训练集对数据模型进行训练,得到模型参数。对所得到的模型参数进行第二隐私保护处理,得到加密模型参数,基于该加密模型参数生成加密数据模型。
其中,第一隐私保护处理使得加密训练集不同于训练集、且加密训练集与训练集的训练结果相同;第二隐私保护处理使得加密模型参数不同于模型参数,且基于加密模型参数生成的加密数据模型与基于模型参数生成的数据模型在输入相同时具有相同的输出结果。
可选地,训练集中还包括一条或多条标记数据,则上述对训练集进行第一隐私保护处理是指对训练集中的训练数据进行第一隐私保护处理,上述使用加密训练集对数据模型进行训练是指使用训练集中经过第一隐私保护处理的训练数据对数据模型进行训练。进一步地,该方法还包括:训练结束后,判断所述训练集中的标记数据的值是否发生变化,是则确定所述加密数据模型无效。
可选地,训练集中的训练数据和标记数据按照均匀分布混合。
可选地,训练集中的训练数据附有标记位,上述对训练集进行第一隐私保护处理,得到加密训练集包括:对训练集中的训练数据进行第一隐私保护处理,得到多条附有标记位的加密训练数据,组成加密训练集。进一步地,该方法还包括:训练结束后,判断加密训练集中是否存在未附有标记位的数据,是则确定加密数据模型无效。
可选地,该方法还包括:获取验证集,在上述基于加密模型参数生成加密数据模型之后,将验证集中的各验证数据的输入项输入至加密数据模型,统计输出结果与相应验证数据的输出项的匹配率,当匹配率高于预设阈值时,确定加密数据模型有效,否则确定加密数据模型无效。其中,验证集中包括一条或多条验证数据,每条验证数据均包括适配于基于模型参数生成的数据模型的输入项和输出项。
可选地,上述对训练集进行第一隐私保护处理包括:根据该训练集,确定第一随机分布噪声函数,基于第一随机分布噪声函数对该训练集进行加噪处理。并且/或者,上述对模型参数进行第二隐私保护处理包括:根据该模型参数,确定第二随机分布噪声函数,基于第二随机分布噪声函数对模型参数进行加噪处理。
可选地,第一随机分布噪声函数包括拉普拉斯分布噪声函数、指数分布噪声函数、或高斯分布噪声函数中的任一项,并且/或者,第二随机分布噪声函数包括拉普拉斯分布噪声函数、指数分布噪声函数、或高斯分布噪声函数中的任一项。
本公开的另一个方面提供了一种数据模型训练装置,包括:输入模块、加密模块、训练模块和输出模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810256461.3/2.html,转载请声明来源钻瓜专利网。