[发明专利]一种图像中的物体检测方法及装置有效
申请号: | 201611249792.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106803071B | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 杨松林 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/73 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 中的 物体 检测 方法 装置 | ||
1.一种图像中的物体检测方法,其特征在于,应用于电子设备,该方法包括:
按照预设的划分方式,将待检测的图像划分为多个网格,其中所述待检测的图像的尺寸为目标尺寸;
将划分后的图像输入到预先训练完成的卷积神经网络中,获取卷积神经网络输出的所述图像的多个特征向量,其中每个网格对应一个特征向量;
针对每个网格对应的特征向量,识别该特征向量中类别参数的最大值,当所述最大值大于设定阈值时,根据所述特征向量中中心点位置参数和外形尺寸参数,确定该类别参数对应类别的物体的位置信息;
其中,所述预设的划分方式包括:
将图像和样本图像划分为行数量和列数量相同的多个网格;
所述方法还包括:
根据所述卷积神经网络对子样本图像中物体的位置和类别的预测,及子样本图像中标注的目标物体的信息,确定所述卷积神经网络的误差;
当所述误差收敛时,确定所述卷积神经网络训练完成,其中所述误差采用以下损失函数确定:
其中,S为划分的网格的行数目和列数目相同时的行数目或列数目、B预先设置的每个网格预测的矩形框的数量,取1或2,xi为标注的目标物体的中心点在该网格i的横坐标,为预测的物体的中心点在该网格i的横坐标,yi为标注的目标物体的中心点在该网格i的纵坐标,为预测的物体的中心点在该网格i的纵坐标,hi为标注的该目标物体所在矩形框的高度,wi为标注的该目标物体所在矩形框的宽度,为预测的该物体所在矩形框的高度,为预测的该物体所在矩形框的宽度,Ci为标注的该网格i当前是否存在目标物体的概率,为预测的该网格i当前是否存在物体的概率,Pi(c)为标注的该网格i内的目标物体归属于类别c的概率,为预测的该网格i内的物体归属于类别c的概率,λcoord和λnoobj为设置的权值,在预测的第j个矩形框内的物体的中心点位于网格i内时取1,否则取0,Iiobj在预测的网格i存在物体的中心点时取1,否则取0,在预测的网格i不存在物体的中心点时取1,否则取0,其中,根据以下公式确定:
Pr(Object)为预测的该网格i当前是否存在物体的概率,Pr(Class|Object)为预测的网格i内的物体归属于类别c的条件概率。
2.根据权利要求1所述的方法,其特征在于,所述按照预设的划分方式,将待检测的图像划分为多个网格之前,所述方法还包括:
判断所述图像的尺寸是否为目标尺寸;
如果否,将所述图像的尺寸调整为目标尺寸。
3.根据权利要求1所述的方法,其特征在于,所述卷积神经网络的训练过程包括:
针对样本图像集合中的每个样本图像,采用矩形框标注目标物体;
按照预设的划分方式将每个样本图像划分为多个网格,确定每个网格对应的特征向量,其中,每个所述样本图像尺寸为目标尺寸,当网格中包含目标物体的中心点时,根据所述目标物体的类别,将该网格对应的特征向量中该类别对应的类别参数的值设置为预先设定的最大值,根据该中心点位于该网格中的位置,确定所述特征向量中中心点位置参数的值,并根据标注的所述目标物体的矩形框的大小,确定所述特征向量中的外形尺寸参数的值,当网格中不包含目标物体的中心点时,该网格对应的特征向量中各参数的值为零;
根据确定了每个网格的特征向量的每个样本图像,对卷积神经网络进行训练。
4.根据权利要求3所述的方法,其特征在于,所述按照预设的划分方式将每个样本图像划分为多个网格之前,所述方法还包括:
针对每个样本图像,判断该样本图像的尺寸是否为目标尺寸;
如果否,将所述样本图像的尺寸调整为目标尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611249792.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序