[发明专利]用于训练新的神经网络的方法、系统及计算机可读介质在审
申请号: | 202110753060.0 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113971423A | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 伊莱·戴维;伊立·鲁宾 | 申请(专利权)人: | 深立方有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 刘彬 |
地址: | 以色列*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 神经网络 方法 系统 计算机 可读 介质 | ||
1.一种用于训练新的神经网络以模仿目标神经网络而不访问所述目标神经网络或所述目标神经网络的原始训练数据集的方法,所述方法包括:
用输入数据探测所述目标神经网络和所述新的神经网络,以生成由相应的所述目标神经网络的一层或多层输出的对应数据和由相应的所述新的神经网络的一层或多层输出的对应数据;
检测使在由所述目标神经网络输出的所述对应数据与由所述新的神经网络输出的所述对应数据之间生成最大差异或高于阈值的差异的输入数据;
生成发散探测训练数据集,所述发散探测训练数据集包括使生成所述最大差异或所述高于阈值的差异的所述输入数据、和由所述目标神经网络输出的所述对应数据;
使用被检测为使在所述新的神经网络与所述目标神经网络之间的对应输出数据中生成所述最大差异或所述高于阈值的差异的所述发散探测训练数据集,来训练所述新的神经网络以生成与所述目标神经网络相同的所述对应输出数据;并且
使用随着所述新的神经网络在训练期间改变而动态地调整的经更新的发散探测训练数据集,来迭代地训练所述新的神经网络。
2.根据权利要求1所述的方法,包括:使用附加的神经网络来生成所述发散探测训练数据集,所述附加的神经网络被训练以输出训练数据,所述训练数据在输入到所述新的神经网络和所述目标神经网络时,导致相应的输出之间具有所述最大差异或所述高于阈值的差异。
3.根据权利要求1所述的方法,包括使用进化模型生成所述发散探测训练数据集,所述进化模型进化以生成这样的输出:所述输出使所述新的神经网络与所述目标神经网络之间的输出差异增大或最大化。
4.根据权利要求1所述的方法,包括通过测试随机种子探测并且基于所述目标神经网络和所述新的神经网络的结果行为外推所述发散探测训练数据集,来生成所述发散探测训练数据集。
5.根据权利要求4所述的方法,其中,多个所述随机种子探测包括在输入空间中彼此不同的多个相应的数据类型或数据分布;并且针对所述发散探测训练数据集,与在输出空间中由所述目标神经网络输出的所述对应数据与由所述新的神经网络输出的所述对应数据之间的所述最大差异或所述高于阈值的差异相关联地选择所述数据类型或所述数据分布。
6.根据权利要求1所述的方法,包括使用基于统计或启发式的方法来生成所述发散探测训练数据集。
7.根据权利要求1所述的方法,包括在每预定次数的训练迭代之后更新所述发散探测训练数据集。
8.根据权利要求1所述的方法,包括在检测到所述新的神经网络和所述目标神经网络的输出差异收敛于所述发散探测训练数据集的先前版本时,更新所述发散探测训练数据集。
9.根据权利要求1所述的方法,其中,针对所述目标神经网络和所述新的神经网络的输出层以及一个或多个隐藏层中的个体或组合,检测由所述目标神经网络输出的所述对应数据与由所述新的神经网络输出的所述对应数据之间的差异。
10.根据权利要求1所述的方法,包括向所述发散探测训练数据集添加新的数据,以将在所述目标神经网络中不存在的新知识并入到所述新的神经网络中。
11.根据权利要求1所述的方法,包括定义要从所述发散探测训练数据集中省略的数据,以从所述新的神经网络中消除存在于所述目标神经网络中的分类或类别。
12.根据权利要求1所述的方法,包括通过向所述发散探测训练数据集分别添加对输出或输入的多个随机相关性,来从所述新的神经网络中去除将所述输入链接到所述输出的相关性,而不访问所述输入以及所述输出中的至少一者,以削弱或消除所述输入与所述输出之间的所述相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深立方有限公司,未经深立方有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753060.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:连接构件
- 下一篇:血小板外泌体结合干细胞外泌体的混合冻晶粉及其制作方法