[发明专利]识别图像中物体的方法及装置、电子设备、可读存储介质在审
申请号: | 201711327168.3 | 申请日: | 2017-12-13 |
公开(公告)号: | CN107992841A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 杨松 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司11415 | 代理人: | 林祥 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 物体 方法 装置 电子设备 可读 存储 介质 | ||
1.一种识别图像中物体的方法,其特征在于,所述方法包括:
确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;
根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;
根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。
2.根据权利要求1所述的识别图像中物体的方法,其特征在于,根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率,包括:
在每一次迭代调整过程中:通过所述特征图获得每个候选区域的特征向量;根据所述特征向量计算所述候选区域的区域信息调整量;利用所述区域信息调整量对所述候选区域的区域信息进行调整,获得调整后的候选区域。
3.根据权利要求2所述的识别图像中物体的方法,其特征在于,根据所述特征向量计算所述候选区域的区域信息调整量之后,所述方法还包括:
判断所述区域信息调整量是否小于或者等于调整量阈值;
如果小于,将调整后的候选区域确定为目标区域;如果大于,重复所述迭代调整过程。
4.根据权利要求2所述的识别图像中物体的方法,其特征在于,根据所述特征向量计算所述候选区域的区域信息调整量之后,所述方法还包括:
判断所述迭代次数是否大于或者等于次数阈值;
如果大于或者等于,将调整后的候选区域确定为目标区域;如果小于,重复所述迭代调整过程。
5.根据权利要求2所述的识别图像中物体的方法,其特征在于,通过所述特征图获得每个候选区域的特征向量,包括:
将每个候选区域按照所述输入图像与所述特征图之间的缩放系数映射至所述特征图中,获得所述每个候选区域对应的特征区域;
对每个特征区域进行最大池化操作,获取预设长度的特征向量。
6.根据权利要求1所述的识别图像中物体的方法,其特征在于,根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域,包括
对比每个目标区域的类别概率与概率阈值;
若所述类别概率小于或等于所述概率阈值,从所述多个目标区域中剔除所述类别概率对应的候选区域,获取得多个目标区域;
对所述多个目标区域进行非极大值抑制处理,获取到物体区域。
7.一种识别图像中物体的装置,其特征在于,所述装置包括:
特征图确定模块,用于确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;
类别概率迭代模块,用于根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;
物体区域识别模块,用于根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。
8.根据权利要求7所述的识别图像中物体的装置,其特征在于,所述类别概率迭代模块包括:
特征向量获取单元,用于在每一次迭代调整时,通过所述特征图获得每个候选区域的特征向量;
调整量计算单元,用于根据所述特征向量计算所述候选区域的区域信息调整量;
候选区域获取单元,用于利用所述区域信息调整量对所述候选区域的区域信息进行调整,获得调整后的候选区域。
9.根据权利要求8所述的识别图像中物体的装置,其特征在于,所述类别概率迭代模块还包括:
第一判断单元,用于判断所述区域信息调整量是否小于或者等于调整量阈值;
第一输出单元,用于在所述区域信息调整量小于或者等于调整量阈值时,将调整后的候选区域确定为目标区域;
第一触发单元,用于在所述区域信息调整量大于调整量阈值时,触发特征向量获取单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711327168.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序