[发明专利]物体识别方法和装置有效
申请号: | 201510918292.1 | 申请日: | 2015-12-10 |
公开(公告)号: | CN105512685B | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 陈志军;李明浩;侯文迪 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11415 北京博思佳知识产权代理有限公司 | 代理人: | 林祥<国际申请>=<国际公布>=<进入国 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 识别 方法 装置 | ||
本公开提供一种物体识别方法和装置。本公开物体识别方法,包括:基于BING在待识别图像中确定至少一个第一候选框,该第一候选框用于标识待检测是否包含目标物体的图像区域;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型;若第一候选框中存在目标物体模型,则标示第一候选框。本公开可大大减少需要比对的候选框的数目,比对次数的减少可加速物体识别过程;其中,采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小,较贴近目标物体的形状,可保证物体识别的精确度,因此,本公开可快速、精确地进行物体识别。
技术领域
本公开涉及图像处理,尤其涉及一种物体识别方法和装置。
背景技术
目前,大部分物体识别方法都是先学习大量的样本,获得学习结果,即物体模型;然后用不同的框遍历需要测试的图片,将遍历的框中的内容依次与物体模型比对,确定框中是否存在此物体模型。然而,对于一幅N*N图像而言,要遍历所有可能的框,需要遍历的次数大约为N的4次方数量级。
发明内容
为克服相关技术中存在的问题,本公开提供一种物体识别方法和装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种物体识别方法,该方法包括:
基于BING方法在待识别图像中确定至少一个第一候选框,该第一候选框用于标识待检测是否包含目标物体的图像区域;
将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型;
若第一候选框中存在所述目标物体模型,则标示第一候选框。
本公开的实施例提供的技术方案可以包括以下有益效果:通过BING方法获取可能包含目标物体的至少一个第一候选框,相对于现有技术,可大大减少需要比对的候选框的数目,因单次比对所持续的时间相对固定,因此,比对次数的减少可加速物体识别过程;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型,若第一候选框中存在目标物体模型,则标示第一候选框,完成对物体的识别,其中,采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小,较贴近目标物体的形状,可保证物体识别的精确度,因此,本公开可快速、精确地进行物体识别。
可选地,上述基于BING方法在待识别图像中确定至少一个第一候选框,包括:采用BING方法对待识别图像进行对象估计,获得该待识别图像中的至少一个第一候选框。
进一步地,上述将第一候选框与目标物体模型进行比对之前,还包括:对至少一个第一候选框进行聚类,确定第二候选框。该第二候选框的个数少于第一候选框的个数。相应地,上述将第一候选框与目标物体模型进行比对,具体为:将第二候选框与目标物体模型进行比对。上述若第一候选框中存在目标物体模型,则标示第一候选框,具体为:若第二候选框中存在目标物体模型,则标示第二候选框。
本公开的实施例提供的技术方案可以包括以下有益效果:通过对至少一个第一候选框进行聚类确定第二候选框,进一步减少需比对的候选框的个数,完成物体识别过程所消耗的时间更少,提升用户体验。
进一步地,上述对至少一个第一候选框进行聚类,确定第二候选框之前,还包括:在至少一个第一候选框中,选取置信分值大于预设值的候选框。该置信分值用于表征候选框中包含目标物体的概率。相应地,上述对至少一个第一候选框进行聚类,确定第二候选框,包括:根据置信分值大于预设值的候选框的大小,对置信分值大于预设值的候选框进行聚类,确定第二候选框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510918292.1/2.html,转载请声明来源钻瓜专利网。