[发明专利]图片识别方法、装置、电子设备及存储介质在审
申请号: | 201910882764.0 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110674720A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 薛竹婷 | 申请(专利权)人: | 深圳市网心科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 44334 深圳市赛恩倍吉知识产权代理有限公司 | 代理人: | 陈海云 |
地址: | 518063 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体识别 真实数据 图片识别 初始训练阶段 准确度 存储介质 电子设备 合成数据 图片输入 微调 图片 | ||
一种图片识别方法,所述方法包括:获取待识别物体图片;将所述待识别物体图片输入至预先训练好的物体识别模型中,其中,所述物体识别模型是基于合成数据集与真实数据集训练得到的,所述真实数据集在模型初始训练阶段以及模型微调阶段均被使用;使用所述物体识别模型对所述待识别物体图片进行识别,获得识别结果。本发明还提供一种图片识别装置、电子设备及存储介质。本发明能提高模型对真实数据的泛化能力,提高模型对物体识别的准确度。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种图片识别方法、装置、电子设备及存储介质。
背景技术
近十年,人工智能飞速发展,计算机视觉的应用遍布人们的生活。常见的应用包括场景检测、人脸识别、物体识别等。这些技术背后的神经网络模型都几乎依赖于深度学习,而深度学习中训练神经网络模型都需要大量带标注的训练数据的支持。
然而,实践中发现,存在一些情况特殊的视觉任务,这些视觉任务适用深度神经网络模型,但是无法从公开途径收集到足够多的样本数据,如图片与视频的鉴黄任务。针对这些特殊的视觉任务,如果使用少量的真实样本直接训练深度神经网络模型会导致模型过拟合,使得训练出来的模型无法对物体进行有效地识别。
因此,如何提高模型对物体识别地准确度是一个亟待解决的技术问题。
发明内容
鉴于以上内容,有必要提供一种图片识别方法、装置、电子设备及存储介质,能够提高模型对真实数据的泛化能力,提高模型对物体识别的准确度。
本发明的第一方面提供一种图片识别方法,所述方法包括:
获取待识别物体图片;
将所述待识别物体图片输入至预先训练好的物体识别模型中,其中,所述物体识别模型是基于合成数据集与真实数据集训练得到的,所述真实数据集在模型初始训练阶段以及模型微调阶段均被使用;
使用所述物体识别模型对所述待识别物体图片进行识别,获得识别结果。
在一种可能的实现方式中,所述获取待识别物体图片之前,所述方法还包括:
获取真实数据集和背景图片集,其中,所述真实数据集由多张携带有背景的物体的图片组成,所述背景图片集由多张背景图片组成;
获取背景透明的多张物体图片,其中,所述多张物体图片中物体的类型与所述真实数据集中的物体的类型一致;
将所述多张物体图片和所述多张背景图片进行随机搭配,生成合成图片,并根据多张所述合成图片,构成合成数据集;
在模型初始训练阶段,使用所述真实数据集以及所述合成数据集对物体识别初始模型进行训练,获得中间模型;
在模型微调阶段,使用所述真实数据集对所述中间模型进行微调,获得训练好的物体识别模型。
在一种可能的实现方式中,所述将所述多张物体图片和所述多张背景图片进行随机搭配,生成合成图片包括:
对所述多张物体图片中的每张物体图片进行随机变换,获得符合真实场景中物体形态变换的多张物体形态图片;
针对每张所述物体形态图片,从所述多张背景图片中,将所述物体形态图片放置在随机选择的第一背景图片的第一位置上;
判断所述物体形态图片的主色与所述第一背景图片在所述第一位置上的主色是否一致;
若所述物体形态图片的主色与所述第一背景图片在所述第一位置上的主色不一致,在所述第一位置上,将所述物体形态图片与所述第一背景图片进行合成,获得第一合成图片。
在一种可能的实现方式中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市网心科技有限公司,未经深圳市网心科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910882764.0/2.html,转载请声明来源钻瓜专利网。