[发明专利]图像识别方法及装置有效
申请号: | 201910395441.9 | 申请日: | 2019-05-13 |
公开(公告)号: | CN111931799B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 周厚谦;钟辉强;刘亮;尹存祥;方军;骆金昌 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/048 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
1.一种图像识别方法,其特征在于,包括:
获取待识别的图像;
将所述待识别的图像输入多个预设的深度残差网络,得到多个识别结果;所述识别结果为,所述待识别的图像中存在目标对象的概率;所述深度残差网络对应的训练数据中,正样本的数量和负样本的数量一致;所述正样本为存在所述目标对象的样本图像;所述负样本为未存在所述目标对象的样本图像;
根据所述多个识别结果,确定所述待识别的图像中是否存在所述目标对象;
其中,所述根据所述多个识别结果,确定所述待识别的图像中是否存在所述目标对象,包括:
获取所述多个识别结果中第一识别结果的数量和第二识别结果的数量;所述第一识别结果为对应的概率大于预设概率阈值的识别结果;所述第二识别结果为对应的概率小于等于预设概率阈值的识别结果;
若所述第一识别结果的数量大于或等于所述第二识别结果的数量,则确定所述待识别的图像中存在目标对象;
若所述第一识别结果的数量小于所述第二识别结果的数量,则确定所述待识别的图像中不存在目标图像。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别的图像输入多个预设的深度残差网络,得到多个识别结果之前,还包括:
获取初始的深度残差网络;所述初始的深度残差网络的全连接输出层神经元个数为1,且激活函数为sigmod函数;
获取样本数据;所述样本数据包括:正样本集合和负样本集合;
按照所述正样本集合中的正样本数量,对所述负样本集合进行欠采样,得到多个负样本子集合;所述负样本子集合中负样本数量与所述正样本数量一致;
根据所述正样本集合和所述多个负样本子集合,确定多个训练数据,采用所述多个训练数据分别对所述初始的深度残差网络进行训练,得到多个预设的深度残差网络。
3.根据权利要求2所述的方法,其特征在于,所述负样本子集合的数量,根据所述正样本集合中正样本数量以及所述负样本集合中负样本数量确定;
所述预设的深度残差网络的数量与所述负样本子集合的数量一致。
4.根据权利要求2所述的方法,其特征在于,所述按照所述正样本集合中的正样本数量,对所述负样本集合进行欠采样,得到多个负样本子集合之前,还包括:
对所述正样本集合中的正样本以及所述负样本集合中的负样本进行尺寸统一以及归一化处理,得到归一化处理后的正样本集合和负样本集合;
对所述正样本集合中的正样本以及所述负样本集合中的负样本进行图像增强处理,根据增强处理后的图像更新所述正样本集合和所述负样本集合;所述增强处理包括:旋转处理。
5.根据权利要求2所述的方法,其特征在于,所述获取初始的深度残差网络,包括:
获取经过ImageNet图像数据集预训练的深度残差网络;
将所述预训练的深度残差网络的全连接层的神经元个数缩减至1,激活函数采用sigmod函数,得到所述初始的深度残差网络。
6.根据权利要求1所述的方法,其特征在于,所述预设概率阈值的确定方式为,
获取样本数据;
将所述样本数据中负样本数量与总样本数量的比值,确定为所述预设概率阈值。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述待识别的图像为遥感卫星图像;
所述目标对象为以下对象中的任意一种:烟囱、烟雾、裸露工地。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910395441.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可折叠的电子设备
- 下一篇:一种洗衣机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序