[发明专利]一种在噪音标注下能够有效识别模型未知错误的方法在审

申请号：	201810529347.3	申请日：	2018-05-29
公开（公告）号：	CN108898226A	公开（公告）日：	2018-11-27
发明（设计）人：	杨静;郑波;徐聪	申请（专利权）人：	华东师范大学
主分类号：	G06N99/00	分类号：	G06N99/00
代理公司：	上海蓝迪专利商标事务所(普通合伙) 31215	代理人：	徐筱梅;张翔
地址：	200241 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种在噪音标注下能够有效识别模型未知错误的方法，其特点是在挑选当前最有可能是模型未知错误时采用动态最近邻算法，降低噪音标注导致的伪未知错误对于标识算法的影响，在有错误标注情况下，基于众包机制对模型进行有效的未知错误识别检测，在有限的预算和固定错误标注率下发现更多模型的未知错误。本发明与现有技术相比具有对模型假设的要求低，只需未知错误不是均匀分布在特征空间上即可，实施简单，易于部署到真实任务中去，在有限的预算和固定错误标注率下发现更多模型的未知错误，同时能够做到发现的未知错误中真正意义上是模型本身存在而不是因为错误标注导致的未知错误的比率高。
搜索关键词：	错误标注标注有效识别噪音最近邻算法标识算法错误识别降低噪音模型假设特征空间发现预算检测部署
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种在噪音标注下能够有效识别模型未知错误的方法，其特征在于在挑选当前最有可能是模型未知错误时采用动态最近邻算法，降低噪音标注导致的伪未知错误对于标识算法的影响，在有错误标注情况下，基于众包机制对模型进行有效的未知错误识别检测，在有限的预算和固定错误标注率下发现更多模型的未知错误，其具体识别按下述步骤进行：步骤a：每次查询的时候从未标注过的样本中随机或挑选当前最有可能是模型未知错误的样本；步骤b：挑选当前最有可能是模型未知错误的时候，借助于一种动态最近邻算法来降低噪音标注导致的伪未知错误对于标识算法的影响，同时能够做到利用已经标注过的样本信息，具体为：(1)、对于每一个已经查询过的点统计附近最近K个被查询过的点是否是未知错误的情况；(2)、拿周围点是未知错误的比率作为该点是未知错误的概率评估；(3)、用该后验估计作为这个点附近最近一个点是否是未知错误的概率近似，同时也是该点是否是由于错误标注导致的伪未知错误的后验估计；(4)、拿每个邻近点的概率估计作为依据，挑出最有可能是未知错误的点进行查询；步骤c：制定贪心策略在随机探索以及利用之间进行取舍，对模型进行有效的未知错误识别检测，在有限的预算和固定错误标注率下发现更多模型的未知错误。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华东师范大学，未经华东师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810529347.3/，转载请声明来源钻瓜专利网。

上一篇：基于人机协同学习的数据标注方法
下一篇：学习率计算方法及装置、分类模型计算方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N99-00 本小类其他各组中不包括的技术主题

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种在噪音标注下能够有效识别模型未知错误的方法在审

专利文献下载