[发明专利]机器学习系统在审
申请号: | 201910438632.9 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110533189A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 商文龄;D.范德瓦尔;H.范胡夫;M.韦林 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 72001 中国专利代理(香港)有限公司 | 代理人: | 刘书航;申屠伟进<国际申请>=<国际公布 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理单元 中间数据 处理路径 前馈神经网络 输出数据 输出路径 机器学习系统 生成处理 输出单元 输出 | ||
1.一种机器学习系统(10),包括:
-输入单元(20);
-处理单元(30);以及
-输出单元(40);
其中,所述输入单元被配置为给所述处理单元提供输入数据;
其中,所述处理单元被配置为处理所述输入数据以生成处理路径输入数据;
其中所述处理单元被配置为实现包括前馈神经网络的第一处理路径以处理所述处理路径输入数据以生成第一中间数据;
其中,所述处理单元被配置为实现包括前馈神经网络的第二处理路径以处理所述处理路径输入数据以生成第二中间数据,其中所述第二处理路径是随机的,
其中,所述处理单元被配置为实现包括前馈神经网络的价值输出路径以处理所述第一中间数据和所述第二中间数据以生成价值输出数据;
其中,所述处理单元被配置为实现包括前馈神经网络的策略输出路径以处理所述第一中间数据和所述第二中间数据以生成策略输出数据;并且其中,输出单元被配置为输出所述价值输出数据和输出所述策略输出数据。
2.根据权利要求1所述的机器学习系统,其中为了处理所述输入数据,所述处理单元被配置为实现前馈神经网络以处理所述输入数据以生成第一输出数据,并且所述处理单元被配置为实现循环神经网络以生成第二输出数据,包括利用所述第一输出数据和从循环神经网络的先前的激活生成的先前的第二输出数据,并且其中所述第二输出数据是处理路径输入数据。
3.根据权利要求1至权利要求2中的任何一个所述的机器学习系统,其中第一处理路径是确定的。
4.根据权利要求3所述的机器学习系统,其中实现第一处理路径以生成第三输出数据包括利用全连接层进行参数化。
5.根据权利要求1至权利要求2中的任何一个所述的机器学习系统,其中第一处理路径是随机的。
6.根据权利要求1至权利要求5中的任何一个所述的机器学习系统,其中实现第二处理路径以生成第二中间数据包括利用因子化高斯分布。
7.根据权利要求6所述的机器学习系统,其中第二处理路径的前馈神经网络的隐含层服从因子化高斯分布。
8.根据权利要求6至权利要求7中的任何一个所述的机器学习系统,其中因子化高斯分布的平均值被计算为第二输出数据的平均值的函数。
9.根据权利要求6至权利要求8中的任何一个所述的机器学习系统,其中因子化高斯分布的方差被计算为第二输出数据的方差的函数。
10.一种实现机器学习系统的方法(100),包括:
a)给处理单元提供(110)输入数据;
b)由所述处理单元处理(120)输入数据以生成处理路径输入数据;
c)由所述处理单元实现(130)包括前馈神经网络的第一处理路径以处理所述处理路径输入数据以生成第一中间数据;
d)由所述处理单元实现(140)包括前馈神经网络的第二处理路径以处理所述处理路径输入数据以生成第二中间数据,其中所述第二处理路径是随机的;
e)由所述处理单元实现(150)包括前馈神经网络的价值输出路径以处理所述第一中间数据和所述第二中间数据以生成价值输出数据;
f)由所述处理单元实现(160)包括前馈神经网络的策略输出路径以处理所述第一中间数据和所述第二中间数据以生成策略输出数据;以及
g)由输出单元输出(170)所述价值输出数据和所述策略输出数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910438632.9/1.html,转载请声明来源钻瓜专利网。