[发明专利]一种消除深度学习模型中未知错误的方法与装置在审
申请号: | 201710579742.8 | 申请日: | 2017-07-17 |
公开(公告)号: | CN109272003A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 杨静;倪梦珺;贺樑;李梦婷 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 钟宗;盛晓颖 |
地址: | 200333 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字描述 学习 复杂结构 模板步骤 模型产生 人工过程 外部数据 训练步骤 训练图片 有效减少 算法 标注 反馈 发布 图片 | ||
本发明提供一种消除深度学习模型中未知错误的方法,包括获取未知错误的类型步骤,获取相似图片步骤,建立文字描述模板步骤,众包发布步骤,获取反馈步骤以及重新训练步骤,对深度学习模型在不涉及内部复杂结构的修改前提下,通过加入少量外部数据的方式即有效减少模型产生的广泛分布于数据中的未知错误。采用了文字描述模板,通过机器算法协助完成训练图片标注,大大简化了众包任务中的人工部分,减少了人工过程中错误,从而有效提高深度学习模型的准确性。
技术领域
本发明涉及通过深度学习模型进行图片标识(Image Caption)的技术领域,尤其是一种消除深度学习模型中未知错误的方法与装置。
背景技术
深度学习模型在Image Caption领域的应用日趋成熟,但是深度学习相应存在的问题是内部的难解释性,即无法显式地详细说明模型表现与优化效果发生的原因,也因此很难在原始模型上进一步改进。
未知错误(Unknown unknowns)是一类广泛存在于各类数据集中的问题,它是由训练数据和测试数据分布不一致导致的一种极难避免或完全消除的问题。解决这类问题的主要难点在于,通过常规的模型评测指标等方法根本无法侦测这类问题,目前只能通过在实际应用中发现或完全人工检测的方式得知该类错误实例。前者危害巨大,在实际使用中造成极大的危险隐患;后者需要投入大量的人力成本,且在海量数据情形下几乎无法进行。
发明内容
针对以上现有问题,本发明的目的在于提供一种针对深度学习中的未知错误的消除方法。
根据本发明的第一个方面,提供一种消除深度学习模型中未知错误的方法,根据训练图片集合训练深度学习模型,将验证图片集合输入深度学习模型以获得与验证图片对应的描述标签,包括以下步骤:获取未知错误的类型步骤,对验证图片集合根据主题划分为验证图片子集,确定出现未知错误的验证图片的场景并获取未知错误的类型;获取相似图片步骤,根据验证图片的场景以及未知错误的类型,获取相似图片集合;建立文字描述模板步骤,建立相似图片的文字描述模板;众包发布步骤,将相似图片集合和文字描述模板以及主题发布至众包平台;获取反馈步骤,获取众包平台返回的与相似图片对应的文字描述模板反馈;重新训练步骤,将文字描述模板反馈以及对应的相似图片放入训练图片集合,以训练深度学习模型。
优选地,建立文字描述模板步骤包括:根据描述标签建立基础模板;确定未知错误在描述标签中出现位置;在基础模板上的对应未知错误的出现位置建立空白标签。
优选地,文字描述模板反馈包括反馈标签,反馈标签对应于与发布的主题相符的相似图片的文字描述模板的空白标签。
优选地,获取相似图片步骤包括根据出现未知错误的验证图片的场景以及未知错误的类型,提取关键字,将关键字与验证图片子集的主题进行匹配,计算匹配度高于阈值的关键字的出现频率,使用出现频率高于阈值的关键字检索相似图片,以获取相似图片集合。
优选地,深度学习模型使用卷积神经网络(CNN)以及递归神经网络(RNN)算法。
优选地,还包括:验证步骤,将文字描述模板反馈以及对应的相似图片放入临时集合,根据反馈标签进行可信度计算,以确定文字描述模板反馈以及对应的相似图片是否放入训练图片集合。
根据本发明的第一个方面,提供一种消除深度学习模型中未知错误的装置,包括:存储单元,用于存储程序,程序被处理单元执行时实现第一方面的消除深度学习模型中未知错误的方法的步骤;执行单元,用于执行存储单元中程序。
本发明的一种消除深度学习模型中未知错误的方法与装置,对深度学习模型在不涉及内部复杂结构的修改前提下,通过加入少量外部数据的方式即有效减少模型产生的广泛分布于数据中的未知错误。采用了文字描述模板,通过机器算法协助完成训练图片标注,大大简化了众包任务中的人工部分,减少了人工过程中错误,从而有效提高深度学习模型的准确性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710579742.8/2.html,转载请声明来源钻瓜专利网。