[发明专利]图像分类模型优化方法、装置及终端有效
申请号: | 201810246754.3 | 申请日: | 2018-03-23 |
公开(公告)号: | CN108614858B | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 张志伟;杨帆 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/50 | 分类号: | G06F16/50;G06F16/55;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像分类模型 中间数据库 噪声数据 优化 噪声数据库 终端 初始训练数据 预设时间段 筛选 修正 用户生成 预测能力 预设规则 时效性 替换 存储 退化 合并 保证 | ||
1.一种图像分类模型优化方法,其特征在于,所述方法包括:
通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;其中,第一图像分类模型基于噪声数据库中存储的噪声数据训练得到;
通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;
按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库;
采用所述第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。
2.根据权利要求1所述的方法,其特征在于,通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库的步骤,包括:
从预设时间段内用户生成的噪声数据中,提取多个噪声数据作为样本数据;
对各所述样本数据进行变换处理,得到各所述样本数据的变换数据;
通过所述第二图像分类模型,对各所述样本数据及各所述变换数据进行标签预测,确定各所述样本数据的目标标签和目标标签概率;
根据各所述样本数据的目标标签及目标标签概率,对各所述样本数据进行筛选,得到第二中间数据库。
3.根据权利要求2所述的方法,其特征在于,所述按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库的步骤,包括:
将所述第一中间数据库与所述第二中间数据库中的各噪声数据,按照目标标签进行分组;
按照目标标签概率对同一分组中的噪声数据进行排序;其中,排序在前的噪声数据的目标标签概率值大;
筛选得到各分组中排序在前的、预设数量的噪声数据,构成第三中间数据库;
分别对所述第三中间数据库中各分组下的噪声数据,进行目标标签抽样校正。
4.根据权利要求3所述的方法,其特征在于,对所述第三中间数据库中一个分组下的噪声数据,进行目标标签抽样校正的步骤,包括:
从所述分组下抽取噪声数据,判断被抽取的噪声数据对应的目标标签是否准确;
若否,对被抽取的所述噪声数据的目标标签进行校正。
5.根据权利要求2所述的方法,其特征在于,所述对各所述样本数据进行变换处理,得到各所述样本数据的变换数据的步骤,包括:
对每个样本数据按照预设变换方式进行变换,得到各所述样本数据的变换数据;其中,预设变换方法包括以下至少之一:旋转、平移以及剪切。
6.一种图像分类模型优化装置,其特征在于,所述装置包括:
修正模块,被配置为通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;其中,第一图像分类模型基于噪声数据库中存储的噪声数据训练得到;
筛选模块,被配置为通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;
合并模块,被配置为按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库;
优化模块,被配置为采用所述第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。
7.根据权利要求6所述的装置,其特征在于,所述筛选模块包括:
提取子模块,被配置为从预设时间段内用户生成的噪声数据中,提取多个噪声数据作为样本数据;变换子模块,被配置为对各所述样本数据进行变换处理,得到各所述样本数据的变换数据;目标标签确定子模块,被配置为通过所述第二图像分类模型,对各所述样本数据及各所述变换数据进行标签预测,确定各所述样本数据的目标标签和目标标签概率;
生成子模块,被配置为根据各所述样本数据的目标标签及目标标签概率,对各所述样本数据进行筛选,得到第二中间数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810246754.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:企业申报科技项目的自评价系统
- 下一篇:智能搜索方法、服务器及存储介质