[发明专利]训练人工神经网络、人工神经网络、应用、计算机程序、存储介质和设备在审
申请号: | 202180044967.8 | 申请日: | 2021-06-23 |
公开(公告)号: | CN115699025A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | D·泰尔耶克 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/047;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 胡莉莉;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 人工 神经网络 应用 计算机 程序 存储 介质 设备 | ||
1.一种用于借助训练数据集(x1直至xt+h)来训练人工神经网络(60)的方法,用以为了控制技术系统而根据过去的连续时间序列(x1直至xt)来预测在时间步(t+1直至t+h)中的未来的连续时间序列(xt+1直至xt+h),所述人工神经网络(60)尤其是贝叶斯神经网络、尤其是递归人工神经网络、尤其是VRNN,该方法具有根据损失函数来适配所述人工神经网络的参数的步骤,其中所述损失函数包括第一项,所述第一项具有对在关于至少一个隐变量(隐变量)的先验概率分布(先验)与关于所述至少一个隐变量(隐变量)的后验概率分布(推断)之间的间距的下界(ELBO)的估计,
其特征在于,
所述先验概率分布(先验)与未来的连续时间序列(xt+1直至xt+h)无关。
2.根据权利要求1所述的方法,其中,所述先验概率分布(先验)不取决于所述未来的连续时间序列(xt+1直至xt+h)。
3.根据上述权利要求中任一项所述的方法(900),其中,借助所述损失函数(/),根据随后的规则来估计所述下界(ELBO),
,
其中表示关于直至范围的未来的时间步的可观测到的变量在过去的时间步的所述可观测到的变量的条件下的目标概率分布,
表示推断,也就是说表示关于在整个观测时段内、也就是说针对所述过去的时间步和直至范围的所述未来的时间步的所述隐变量在所述整个观测时段内的所述可观测到的变量的条件下的后验概率分布(推断),
表示生成器,也就是说表示关于直至范围的所述未来的时间步的所述可观测到的变量在所述过去的时间步的所述可观测到的变量和在所述整个观测时段内的所述隐变量的条件下的概率分布,和
表示先验,也就是说表示关于所述隐变量在所述过去的时间步的所述可观测到的变量的条件下的所述先验概率分布(先验)。
4.计算机程序,其设立为,执行根据权利要求1至3中任一项所述的方法(900)的所有步骤。
5.机器可读的存储介质,其上存储有根据权利要求4所述的计算机程序。
6.人工神经网络(60)、尤其是贝叶斯神经网络,其借助根据权利要求1至3中任一项所述的方法(900)来训练。
7.权利要求6的人工神经网络(60)、特别是贝叶斯神经网络用于控制技术系统的应用,所述技术系统尤其是机器人、车辆、工具或者工厂机器(11)。
8.计算机程序,其设立为,执行根据权利要求7所述的将根据权利要求6所述的人工神经网络(60)用于控制技术系统的应用的所有步骤。
9.机器可读的存储介质,其上存储有根据权利要求8所述的计算机程序。
10.用于控制技术系统的设备,所述设备设立用于根据权利要求7所述的应用根据权利要求6所述的人工神经网络(60)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180044967.8/1.html,转载请声明来源钻瓜专利网。