[发明专利]模型的优化方法、装置及电子设备有效
申请号: | 201911157999.X | 申请日: | 2019-11-22 |
公开(公告)号: | CN111027707B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 苏驰;李凯;刘弘也 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06F18/214 |
代理公司: | 北京博遵律师事务所 11761 | 代理人: | 马佑平 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 优化 方法 装置 电子设备 | ||
1.一种模型的优化方法,包括:
获取待优化模型的错例集,其中,所述待优化模型为使用训练集通过机器学习对初始模型进行训练得到,所述训练集包括至少一张样本图像和与每张样本图像对应的人工标签,所述错例集包括至少一个错判图像和与每张错判图像对应的错判标签,所述错判标签为所述待优化模型对所述错判图像的预测结果;
使用所述训练集和错例集通过机器学习对所述待优化模型进行训练,以调整所述待优化模型的初始参数,得到优化模型;
所述使用所述训练集和错例集通过机器学习对所述待优化模型进行训练,以调整所述待优化模型的初始参数,得到优化模型,包括:
基于所述待优化模型对所述样本图像进行预测,得到与每张样本图像对应的第一预测结果;
基于所述待优化模型对所述错判图像进行预测,得到与每张错判图像对应的第二预测结果;
将所述第一预测结果和所述第二预测结果代入预设的损失函数进行计算,得到每张样本图像和错判图像的共同损失;
基于所述共同损失对所述待优化模型的初始参数进行更新,得到优化模型;
其中,将所述第一预测结果中每个元素和第二预测结果中每个元素代入式(1)进行计算,得到样本图像和错判图像共同损失Ltotal,
其中,代表错判图像对应的错判标签,y代表样本图像X对应的人工标签,代表对应的第一概率分布向量p中元素,py代表y对应的第二概率分布向量p中元素。
2.根据权利要求1所述的方法,其中,所述基于所述待优化模型对所述样本图像进行预测,得到与每张样本图像对应的第一预测结果包括:
从所述训练集中选取一张样本图像,将选取的样本图像输入所述待优化模型,得到第一输出结果;
将所述第一输出结果输入归一化函数,得到第一概率分布向量。
3.根据权利要求1所述的方法,其中,所述基于所述待优化模型对所述错判图像进行预测,得到与每张错判图像对应的第二预测结果,包括:
从所述错例集中选取一张错判图像,将选取的错判图像输入所述待优化模型,得到第二输出结果;
将所述第二输出结果输入归一化函数,得到第二概率分布向量。
4.根据权利要求1所述的方法,其中,
所述第一预测结果包括多个元素,每个元素对应一种类别的人工标签,每个元素用于表示所述待优化模型将所述样本图像预测为与其对应类别的人工标签的概率;
所述第二预测结果包括多个元素,每个元素对应一种类别的错判标签,每个元素用于表示所述待优化模型将所述错判图像预测为与其对应类别的错判标签的概率;
所述将所述第一预测结果和第二预测结果代入预设的损失函数进行计算,得到每张样本图像和错判图像的共同损失,包括:
将所述第一预测结果中每个元素和第二预测结果中每个元素代入预设的损失函数进行计算,得到样本图像和错判图像的共同损失。
5.根据权利要求1所述的方法,其中,所述基于所述共同损失对所述待优化模型的初始参数的进行更新,得到优化模型,包括:
基于所述共同损失和预设的反向传播算法计算所述待优化模型中初始参数的导数;
基于所述初始参数的导数和梯度下降算法对所述待优化模型中的初始参数的进行更新;
基于多张样本图像和错判图像的共同损失对所述待优化模型中的参数进行多次更新,直到收敛,得到优化模型。
6.一种图像识别方法,包括:
获取待识别图像;
基于权利要求1-5任一项所述的方法得到的优化模型对所述待识别图像进行识别,得到相应的识别标签;
反馈所述待识别图像的识别标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911157999.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防爆缓冲结构的防爆板材
- 下一篇:一种环氧橘皮防滑地坪漆及其制备方法