[发明专利]图像识别方法、装置、电子设备以及存储介质有效
申请号: | 202210013240.X | 申请日: | 2022-01-06 |
公开(公告)号: | CN114359904B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 杨夏浛;钦夏孟;谢群义;徐杨柳;张胜;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/18;G06V30/19;G06V10/82;G06V10/70;G06N3/08 |
代理公司: | 北京猷德知识产权代理有限公司 16084 | 代理人: | 范继晨 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 以及 存储 介质 | ||
本公开提供了一种图像识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,应用于图像识别场景,以至少解决相关技术中模型识别的准确率较低的技术问题。具体实现方案为:获取目标图像,其中,目标图像包括待识别对象;利用目标模型对目标图像进行对象识别,得到识别结果;其中,目标模型分别使用多组训练数据通过机器学习训练得到,多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,第一组训练数据、第二组训练数据、第三组训练数据的损失梯度不同。
技术领域
本公开涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,应用于图像识别场景,尤其涉及一种图像识别方法、装置、电子设备以及存储介质。
背景技术
目前的文本识别算法大部分基于对于拼音类型文字的识别方式进行改进,但是,目前对于汉字识别的需求逐渐增长,多数场景需要进行准确的汉字识别,然而现有的模型识别效果较差。
发明内容
本公开提供了一种图像识别方法,以至少解决相关技术中模型识别的准确率较低的技术问题。
根据本公开的一方面,提供了一种图像识别方法,包括:获取目标图像,其中,目标图像包括待识别对象;利用目标模型对目标图像进行对象识别,得到识别结果;其中,目标模型分别使用多组训练数据通过机器学习训练得到,多组训练数据至少包括:第一组训练数据、第二组训练数据、第三组训练数据,第一组训练数据、第二组训练数据、第三组训练数据的损失梯度不同。
可选地,该方法还包括:获取目标训练数据;利用目标训练数据对原始模型进行训练,得到第一训练结果;基于第一训练结果确定目标训练数据对应的第一损失梯度;基于第一损失梯度对目标训练数据进行分组,得到多组训练数据;利用多组训练数据对原始模型进行训练,得到目标模型。
可选地,基于第一损失梯度对目标训练数据进行分组,得到多组训练数据,包括:基于预设损失梯度和第一损失梯度对目标训练数据进行分组,得到第一组训练数据、第二组训练数据和第三组训练数据,其中,第一组训练数据的损失梯度大于第二组训练数据的损失梯度、二组训练数据的损失梯度大于第三组训练数据的损失梯度。
可选地,利用多组训练数据对原始模型进行训练,得到目标模型,包括:对第一组训练数据进行增强处理,得到第四组训练数据;利用第二组训练数据、第三组训练数据和第四组训练数据对原始模型进行训练,得到目标模型。
可选地,利用第二组训练数据、第三组训练数据和第四组训练数据对原始模型进行训练,得到目标模型,包括:利用第二组训练数据、第三组训练数据和第四组训练数据对原始模型进行训练,得到第二训练结果;对第三组训练数据中的每个数据进行标识处理,得到标识处理后的第三组训练数据,其中,标识处理后的第三组训练数据中每个数据包含至少一个目标标识;基于第四组训练数据和标识处理后的第三组训练数据对目标训练数据进行更新,得到更新后的目标训练数据;利用第二训练结果对更新后的目标训练数据进行分组,得到多组训练数据;利用多组训练数据对原始模型进行训练,得到目标模型。
可选地,在基于第四组训练数据和标识处理后的第三组训练数据对目标训练数据进行更新,得到更新后的目标训练数据之后,该方法还包括:检测标识处理后的第三组训练数据中每个数据包含目标标识的目标数量;响应于处理后的第三组训练数据存在目标数据包含目标标识的目标数量大于或等于预设数量,从处理后的第三组训练数据中删除目标数据,得到删除处理后的第三组训练数据;基于第四组训练数据和删除处理后的第三组训练数据对目标训练数据进行更新,得到更新后的目标训练数据。
可选地,该方法还包括:响应于多组训练数据的数据总量小于预设数量,停止利用多组训练数据对原始模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210013240.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序