[发明专利]用于估计由监督机器学习器做出的决策的不确定性的系统和方法有效
申请号: | 201980008950.X | 申请日: | 2019-01-30 |
公开(公告)号: | CN111615676B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | S·科洛瑞;H·霍夫曼 | 申请(专利权)人: | 赫尔实验室有限公司 |
主分类号: | G05D1/00 | 分类号: | G05D1/00;G05B15/02;G06N3/0455;G06N3/094;G06N3/09;G06N3/0464 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李艳芳;王小东 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 估计 监督 机器 学习 做出 决策 不确定性 系统 方法 | ||
描述了一种用于对自主平台进行控制的系统。基于输入图像,系统生成针对自主平台的电动机控制命令决策。确定输入图像属于训练图像集合的概率,并且使用所确定的概率生成针对电动机控制命令决策的可靠性度量。当可靠性度量高于预定阈值时,执行探索动作。否则,当可靠性度量低于预定阈值时,执行与电动机控制命令决策相对应的利用动作。
相关申请的交叉引用
这是于2018年3月26日在美国提交的标题为“System and Method forEstimating Uncertainty of the Decisions Made by a Supervised Machine Learner(用于估计由监督式机器学习器做出的决策的不确定性的系统和方法)”的美国临时申请No.62/648,304的非临时申请,其全部内容通过引用并入本文中。
技术领域
本发明涉及用于估计由监督机器学习器做出的决策的不确定性的系统,并且更具体地,涉及用于估计自主平台的控制输出的可靠性的系统。
背景技术
用于将输入数据映射到决策的现有方法使用深度神经网络。这些方法的缺点是它们不提供针对新数据与训练集合的匹配程度的置信度。深度神经网络可以为远离训练数据的分布的新数据点提供高置信度决策,但是训练分布之外的数据点将导致不可靠决策。
用于估计数据分布的现有技术是高斯混合模型(GMM)(参见所并入的参考文献的列表,参考文献1和8),这是描述数据的概率密度函数。估计GMM参数的现有方法基于相对于参数使数据的负对数似然(NLL)最小化(参见参考文献8)。期望最大化(EM)算法(参见参考文献2)是最小化NLL的重要方式。然而,其保证仅收敛到似然函数的固定点,而不能找到全局最优值。
各种研究已经表明,似然函数具有坏局部最大值,与任何全局最大值相比,局部最大值可能具有任意较差的对数似然值(参见参考文献4和6)。此外,Jian等人(参见参考文献5)证明:采用随机初始化,EM算法将很可能收敛到坏临界点。此问题使EM算法对初始参数的选择敏感。
当前生成对抗网络(GAN)(参见参考文献3)方法接收已知分布(例如,多元高斯分布)并且将其映射到图像分布(即,生成合成图像)。因此,当前GAN没有把重点放在对数据分布进行聚类。另外,考虑到输入数据分布(即,多元高斯分布)是典型现实世界数据分布的极差近似,所以GAN很难生成代表训练集合的良好数据点。
因此,持续需要一种系统来改进机器学习系统的不确定性估计,以使得能够针对提供较差结果的机器学习系统进行更好针对性学习。
发明内容
本发明涉及用于估计由监督机器学习器做出的决策的不确定性的系统,并且更具体地,涉及用于估计自主平台的控制输出的可靠性的系统。
该系统包括一个或更多个处理器以及非暂时性计算机可读介质,该非暂时性计算机可读介质编码有可执行指令,使得可执行指令在被执行时,一个或更多个处理器执行多个操作。对于输入图像,系统生成针对自主平台的电动机控制命令决策。确定输入图像属于训练图像集合的概率。使用所确定的概率来生成用于电动机控制命令决策的可靠性度量。如果可靠性度量高于预定阈值,则系统使自主平台执行探索动作。如果可靠性度量低于预定阈值,则系统使自主平台执行与电动机控制命令决策相对应的利用动作。
在另一方面,在确定输入图像属于看到过的图像类的概率时,该系统学习用于输入数据的分布的嵌入。
在另一方面,在学习用于输入数据的分布的嵌入时,使用切片沃瑟斯坦(Wasserstein)聚类技术。
在另一方面,在执行索动作时,自主平台在环境的围绕自主平台的区域中收集附加输入数据。
在另一方面,在执行利用动作时,自主平台执行导致预先指定目标的电动机控制命令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赫尔实验室有限公司,未经赫尔实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980008950.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:锂硫电池用隔膜和包含所述隔膜的锂硫电池
- 下一篇:失速引起的振动控制