[发明专利]用于操作学习系统的方法和设备在审
申请号: | 202010381572.4 | 申请日: | 2020-05-08 |
公开(公告)号: | CN111914992A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | M.坎德米尔;M.豪斯曼 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 毕铮;申屠伟进 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 操作 学习 系统 方法 设备 | ||
提供了用于操作学习系统的方法和设备。学习系统(100)包括至少一个处理器和用于可由处理器执行的指令的至少一个存储器,至少一个处理器被适配成执行指令以用于:从多个图像表示中选择图像表示(xn);确定针对图像的至少一个第一标签的第一表示(y);在预测中确定至少一个第二标签的第二表示(yn);基于图像表示(xn)、第一表示(y)和第二表示(yn)确定第二表示(yn)的预测的不确定性;取决于图像表示(xn)和/或第二表示(yn)确定回报(R);以及取决于不确定性和回报(R)选择另一图像的另一表示,其中系统(100)被适配成确定用于基于视频或基于图像的系统的至少一个控制信号,其中系统(100)被适配成取决于传感器输出来处理图像。
背景技术
本发明涉及用于操作学习系统的方法和设备,特别是用于训练人工神经网络的学习系统。
在监督式学习中,用于视频和/或图像处理的人工神经网络通过使用包括经加标签的图像的训练数据来被训练。创建经加标签的图像的集合来用于训练是繁重并且昂贵的。因而合期望的是对针对训练而言特别有用的图像进行标识和加标签。
在一个方面中,获取函数被用于标识来自图像集合的图像。获取函数是确定性函数,其例如基于在与图像内容(诸如颜色等等)相关的信息方面所定义的熵或互信息来选择图像。
针对特定图像集合的单独的获取函数的有用性取决于图像的数据。为了使用特别有用的获取函数,例如S.Ebert,M.Fritz,B.Schiele的“RALF: A Reinforced ActiveLearning Formulation for Object Class Recognistion”(CVPR, 2012 IEEEConference on Computer Vision and Pattern Recognition(关于计算机视觉和模式识别的IEEE会议), 3626-3633页)公开了一种方法,其基于可用启发法的集合来对策略进行学习以从预定的并且确定性的获取函数的集合中选择获取函数。
发明内容
学习系统的进一步的改进通过根据独立权利要求的计算机实现的方法和学习系统来实现。
操作学习系统的计算机实现的方法包括:特别地通过引导(guide)来从多个图像表示中选择图像表示;特别地通过预言(oracle)来确定针对图像的至少一个第一标签的第一表示;特别地通过预测器(predictor)来在预测中确定至少一个第二标签的第二表示;特别地通过预测器、基于所述图像表示、第一表示和第二表示来确定第二表示的预测的不确定性;取决于所述图像表示和/或第二表示来确定回报;以及取决于所述不确定性并取决于所述回报来选择另一图像的另一表示;确定用于基于视频或基于图像的监视系统、顾客监控系统、安全工程系统、驾驶员辅助系统、多功能舒适系统、在载具控制中具有干预的安全关键的辅助系统、用于融合驾驶员信息或驾驶员辅助的系统、机器人系统、家用或花园工作机器人系统、联网或协作性机器人系统的至少一个控制信号,其中所述控制信号响应于针对学习系统所捕获的至少一个图像的输入、作为所述系统的输出来被确定,其中所述系统被适配成取决于图像、视频、雷达、LiDAR(光探测和测距)、超声或运动传感器的传感器输出来处理图像。因而,在主动学习设置中根据加强反馈来对自由形式获取启发法进行学习,而无需任何经加标签的数据集合来生成回报。该方法可适用于预测器,所述预测器报告其不确定性,例如预测方差。这样,提供了经改进的自学习控制方法。该控制在许多应用中、特别是在汽车或器具领域中也是非常有用的。
有利地,所述回报取决于模型——其特别是针对预测器的——以及模型拟合的第一度量与模型拟合的第二度量的比较来被确定,其中第一度量取决于在利用所述表示来训练模型之前所确定的模型的至少一个第一参数以及取决于在利用所述表示来训练模型之后所确定的模型的至少一个第二参数来被确定。这样,模型拟合的度量(例如边际似然)用于在利用新图像训练之前和之后、根据不确定性来确定针对新图像的回报。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010381572.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无线电力传递装置
- 下一篇:用于监控SCR催化净化器的方法