[发明专利]图像标签识别方法、装置及服务器有效
申请号: | 201810712097.7 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109117862B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 张志伟;李岩;吴丽军 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本图像 图像标签 图像分类模型 标签识别 损失函数 图像 构建 路由 服务器 标签 视觉 标签分类 分类模型 目标分类 目标图像 相近样本 训练目标 准确度 细化 提示 | ||
本公开是关于一种图像标签识别方法、装置及服务器,其中所述方法包括:基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别。通过上述图像标签识别方法,能够将标签分类更加细化,提示目标分类模型的标签识别准确度。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像标签识别方法、装置及服务器。
背景技术
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得其在目标检测、分类等计算机视觉任务中所得预测结果的精度大幅提升。视频图像等多媒体数据在卷积神经网络中逐层传播时的中间结果也被从模型中剥离出来,作为描述输入数据的特征。这些特征同样被广泛应用在相似人脸检测、视频图像检索等领域。
虽然卷积神经网络的中间结果可以被抽离出来作为特征直接应用于相似人脸检测等领域,但是直接从卷积神经网络网络中获取的特征存在如下几个缺点:
缺点一、提取的特征粒度较粗,即特征可产生区分效果,但区分效果差;缺点二、该种特征提取方法会在同批样本内选取最困难的样本作为损失参与计算,该种特征提取方法所提取的特征训练的图像分类模型时,模型收敛速度慢。上述两个缺点最终将导致图像分类模型标签识别准确度低、训练难度大的问题。
发明内容
为克服相关技术中存在的问题,本发明公开提供了一种图像标签识别方法、装置及服务器。
根据本公开实施例的第一方面,提供一种图像标签识别方法,包括:基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别。
根据本公开实施例的第二方面,提供一种图像标签识别装置,包括:构建模块,被配置为基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;选择模块,被配置为从所述预先标记的样本图像中选择一批样本图像;确定模块,被配置为通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;训练模块,被配置为依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;识别模块,被配置为通过所述目标图像分类模型,对待识别图像进行标签识别。
根据本公开实施例的第三方面,提供一种图像标签识别装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别根据本公开实施例的第四方面,提供一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像标签识别程序,所述图像标签识别程序被所述处理器执行时实现本发明中所述的任意一种图像标签识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810712097.7/2.html,转载请声明来源钻瓜专利网。