[发明专利]用于训练分类器的装置和方法在审
申请号: | 202011379943.1 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112990248A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | R·法托尼;F·施密特;J·Z·科尔特 | 申请(专利权)人: | 罗伯特·博世有限公司;卡内基梅隆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜凝;刘茜 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 分类 装置 方法 | ||
本发明涉及用于训练分类器的装置和方法。一种用于训练分类器(60)、具体地二元分类器的计算机实施的方法,该分类器用于根据不可分解的度量对输入信号()进行分类以优化性能,该不可分解的度量衡量对应于一组训练数据的输入信号()的类别()和从所述分类器获得的所述输入信号的对应预测类别()之间的对齐,所述方法包括以下步骤:‑提供加权因子,这些加权因子表征所述不可分解的度量如何依据来自所述类别()和所述预测类别()的混淆矩阵的多个项;‑依据提供的所述加权因子来训练所述分类器(60)。
技术领域
本发明涉及一种用于训练分类器的方法、一种用于使用该分类器的方法、一种计算机程序和一种机器可读存储介质、一种控制系统以及一种训练系统。
背景技术
Zhan Shi、Xinhua Zhang和Yaoliang Yu在Advances in Neural InformationProcessing Systems(神经信息处理系统进展),2017年第6033–6043页中的“Bregmandivergence for stochastic variance reduction: Saddle-point and adversarialprediction(用于随机方差消减的布雷格曼散度:鞍点和对抗性预测)”公开了一种用于通过应用使用边缘化的对抗性预测技术优化F1分数度量(score metric)的机器学习方法,该边缘化减少对全指数大小的条件分布在其多项式大小的边缘分布中的优化。
Hong Wang、Wei Xing、Kaiser Asif和Brian Ziebart在Advances in NeuralInformation Processing Systems(神经信息处理系统进展),2015年第2710–2718页)中的“Adversarial prediction games for multivariate losses(针对多元损失的对抗性预测游戏)”公开了使用双甲骨文(double oracle)技术来为一些性能度量训练分类器。
发明内容
本发明的优点
尽管准确率度量是最受欢迎的评估量度,但是许多应用要求使用更复杂的评估度量,这些评估度量不能够累加分解为呈样本方式的量度,即它们不能表达为评估数据集中的各个样本的贡献之和。
在现实世界应用中,机器学习算法的性能优选地利用专门针对感兴趣问题制定的评估度量来衡量。这样的评估度量常常是不可分解的度量。
例如,在光学查验任务(其可例如在工业生产环境中使用以自动检查生产的商品是否根据规格生产)中,可期望使用精确率、召回率、特异度或Fβ分数作为这样的不可分解的度量的示例。
例如,假设标签“1”意指“OK”,且“0”意指“不OK”。精确率(即,真阳性样本和预测阳性样本之间的比率)衡量有多少个“1”-标签实际正确的百分比。精确率为100%的生产线末端检查将导致一个有缺陷产品也不运送。在针对高精确率训练的机器中,也可设想依赖于所有“1”标签并且仅针对被标记为“0”的那些生产的商品实施(潜在地非常昂贵)重新检查。
召回率(即,真阳性和实际阳性之间的比率)衡量实际有多少个“OK”例被正确标记的百分比。如果召回率很高,则可设想放弃被标记为“ 0”的商品的昂贵的重新检查并立即将其丢弃。
特异度(即,真阴性和实际阴性之间的比率)衡量有多少个“不OK”例被正确标记为“0”的百分比。如果特异度高,则可设想立即运送被标记为“1”的所有商品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司;卡内基梅隆大学,未经罗伯特·博世有限公司;卡内基梅隆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011379943.1/2.html,转载请声明来源钻瓜专利网。