[发明专利]用稀疏数据训练神经网络的系统和方法在审
申请号: | 201810589639.6 | 申请日: | 2018-06-08 |
公开(公告)号: | CN109034385A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | C·J·蒙克贝里;J·N·T·黑塞尔格伦;J·T·莱赫蒂宁;T·O·艾拉 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;娄晓丹 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络模型 目标向量 输出向量 输入向量 稀疏 训练神经网络 样本子集 计算机可读介质 目标数据 输出数据 稀疏数据 训练数据 样本产生 减小 | ||
1.一种用于训练神经网络模型的计算机实现的方法,包括:
从包括输入向量和稀疏目标向量的一组训练数据中选择输入向量,其中每个稀疏目标向量包括对应于神经网络模型的输出向量内的样本子集的目标数据;
通过所述神经网络模型处理所述输入向量,以针对所述输出向量内的样本产生输出数据;以及
调整所述神经网络模型的参数值,以针对所述样本子集减小所述输出向量与所述稀疏目标向量之间的差。
2.根据权利要求1所述的计算机实现的方法,其中所述输入向量的分辨率低于所述输出向量的分辨率。
3.根据权利要求1所述的计算机实现的方法,其中每个稀疏目标向量不同于所述组训练数据中的其他稀疏目标向量。
4.根据权利要求1所述的计算机实现的方法,其中所述输入向量包括针对所述输出向量内的所述样本的第二子集的输入数据。
5.根据权利要求4所述的计算机实现的方法,其中所述样本的所述第二子集与所述样本子集不相关。
6.根据权利要求1所述的计算机实现的方法,其中指示所述样本子集中的样本的强度的密度掩码被用于缩放所述差。
7.根据权利要求6所述的计算机实现的方法,其中与每一个所述稀疏目标向量相对应的所述密度掩码不同。
8.根据权利要求1所述的计算机实现的方法,其中针对所述样本子集中的每个样本计算所述差的一部分,并且未包括在所述样本子集中的样本的剩余样本的所述差的剩余部分被设置为零。
9.根据权利要求1所述的计算机实现的方法,其中指示所述样本子集中的所述样本的位置的位掩码被用于计算所述差。
10.根据权利要求9所述的计算机实现的方法,其中与每个所述稀疏目标向量相对应的所述位掩码不同。
11.根据权利要求1所述的计算机实现的方法,其中与每个所述稀疏目标向量中的所述样本子集中的样本相对应的位置不同。
12.根据权利要求1所述的计算机实现的方法,还包括:
对于至少一个附加输出,重复选择所述输入向量并处理所述输入向量;以及
在调整所述参数值之前,将针对所述输出向量的差和针对至少一个附加输出向量的附加差组合,然后调整所述整神经网络模型的参数值以减小所述组合的差。
13.一种系统,包括:
存储器,其存储包括输入向量和稀疏目标向量的一组训练数据,其中每个稀疏目标向量包括对应于神经网络模型的输出向量内的样本子集的目标数据;
并行处理单元,其耦合到所述存储器并且被配置为:
从所述组训练数据中选择输入向量;
通过所述神经网络模型处理所述输入向量以针对所述输出向量内的样本产生输出数据;以及
调整所述神经网络模型的参数值,以针对所述样本子集减小所述输出向量与所述稀疏目标向量之间的差。
14.根据权利要求13所述的系统,其中所述输入向量的分辨率低于所述输出向量的分辨率。
15.根据权利要求13所述的系统,其中每个稀疏目标向量不同于所述组训练数据中的其他稀疏目标向量。
16.根据权利要求13所述的系统,其中所述输入向量包括针对所述输出向量内的所述样本的第二子集的输入数据。
17.根据权利要求16所述的系统,其中所述样本的所述第二子集与所述样本子集不相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589639.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和装置
- 下一篇:一种基于资源调度器的深度学习系统及其方法