[发明专利]图像标签识别方法、装置及服务器有效
申请号: | 201810712097.7 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109117862B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 张志伟;李岩;吴丽军 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本图像 图像标签 图像分类模型 标签识别 损失函数 图像 构建 路由 服务器 标签 视觉 标签分类 分类模型 目标分类 目标图像 相近样本 训练目标 准确度 细化 提示 | ||
1.一种图像标签识别方法,其特征在于,所述方法包括:
基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图,所述标签视觉路由图中包含多个标签以及各标签到其他标签的路由比例;
从所述预先标记的样本图像中选择一批样本图像;
通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;
依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;
通过所述目标图像分类模型,对待识别图像进行标签识别。
2.根据权利要求1所述的方法,其特征在于,所述基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图的步骤,包括:
通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像对应的目标标签;其中,每个样本图像对应预设数量各目标标签;
将所述预先标记的样本图像按照标签进行分组;其中,每个标签对应一个分组;
针对每个标签,确定所述目标标签中所述标签的个数;
针对每个分组,将所述个数与所述分组中样本图像的个数之商,确定为所述标签到所述分组对应的标签的路由比例;
依据各标签间的路由比例,绘制标签视觉路由图。
3.根据权利要求2所述的方法,其特征在于,所述通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像对应的目标标签的步骤,包括:
所述通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像的预测向量;其中,预测向量中包含多个点,每个点对应一个标签和一个概率值;
针对每个预测向量,将所述预测向量中各点的概率值由大到小进行排序;
将排序在前的预设数量的概率值对应的标签,确定为所述预测向量对应的样本图像的目标标签。
4.根据权利要求1所述的方法,其特征在于,通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像的步骤,包括:
针对所述批样本图像中的每个样本图像,确定所述样本图像所属的第一标签;
确定与所述第一标签间路由比例最小的第二标签,从所述第二标签对应分组中随机提取一个样本图像,作为所述样本图像的最相近样本图像;
确定与所述第一标签间路由比例最大的第三标签,从所述第三标签对应分组中随机提取一个样本图像,作为所述样本图像的最困难样本图像。
5.根据权利要求1所述的方法,其特征在于:
图像对损失平均值计算函数与预设的分类损失函数加权之和,为所述目标损失函数。
6.一种图像标签识别装置,其特征在于,所述装置包括:
构建模块,被配置为基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图,所述标签视觉路由图中包含多个标签以及各标签到其他标签的路由比例;
选择模块,被配置为从所述预先标记的样本图像中选择一批样本图像;
确定模块,被配置为通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;
训练模块,被配置为依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;
识别模块,被配置为通过所述目标图像分类模型,对待识别图像进行标签识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810712097.7/1.html,转载请声明来源钻瓜专利网。