[发明专利]目标框预测方法、装置、设备及介质在审
申请号: | 202011348833.9 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112613525A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王英明;杨同 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王婷婷 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 预测 方法 装置 设备 介质 | ||
本发明实施例提供了一种目标框预测方法、装置、设备及介质,所述方法包括:对图像中预设类别的多个目标进行检测,得到多个候选预测框;确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间的重合度;从所述各个候选预测框中,确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框;根据所述多个匹配预测框与所述多个标注框之间的匹配关系,确定所述预设类别的多个目标在所述图像中匹配的目标预测框。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种目标框预测方法、装置、 设备及介质。
背景技术
目前,基于深度学习的物体检测方法会利用卷积神经网络提取图像的深 度特征,在用这些深度特征预测图像中各个目标所属类别的概率以及对应目 标框的位置。
在通过卷积神经网络进行目标框的预测时,其预测结果一般是与图像的 标注框进行比较,从而根据比较结果区分出预测的准确度,例如,目标框的 预测结果和标注框之间的交并比大于某个阈值,则认为预测结果是准确的, 小于某个阈值则认为预测结果是错误的,从而可以评估卷积神经网络的性 能。因此,如何确定预测结果与标注框之间的对应关系,对卷积神经网络模 型的的图像识别准确度有较大的影响。
实际中,卷积神经网络是同时对数量众多的目标框进行预测,一般,预 测框的数目远大于标注框的数量。此种情况下,经常导致目标框的预测结果 和标注框之间进行了不合理的对应,造成预测结果的正确与否的判定不够合 理和准确,导致卷积神经网络模型的图像识别准确度较低,即预测结果的置 信度较低。
发明内容
鉴于上述问题,提出了本发明实施例的一种目标框预测方法、装置、设 备及介质,以便克服上述问题或者至少部分地解决上述问题。
为了解决上述问题,本发明的第一方面,公开了一种目标框预测方法, 所述方法包括:
对图像中预设类别的多个目标进行检测,得到多个候选预测框;
确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间 的重合度;
从所述各个标注框中,确定与所述多个标注框匹配且使得重合度之和最 大的多个匹配预测框;
根据所述多个匹配预测框与所述多个标注框之间的匹配关系,确定所述 预设类别的多个目标在所述图像中匹配的目标预测框。
可选地,从所述各个标注框中,确定与所述多个标注框匹配且使得重合 度之和最大的多个匹配预测框,包括:
基于所述多个候选预测框以及所述各个标注框,构建第一EMD模型, 其中,以每个候选预测框为一个节点,每个标注框为一个节点,构建每个候 选预测框所在的节点到每个标注框所在的节点之间的边,所述第一EMD模 型包括的各个边的流表征所连接的两个节点所表征的两个框之间匹配的概 率,所述第一EMD模型包括的各个边的代价表征所连接的两个节点所表征 的两个框之间的重合度;
对所述第一EMD模型求解,确定与所述多个标注框匹配且使得重合度 之和最大的多个匹配预测框。
可选地,对所述第一EMD模型求解,确定与所述多个标注框匹配且使 得重合度之和最大的多个匹配预测框,包括:
求解以下线性规划方程,以确定与所述多个标注框匹配且使得重合度之 和最大的多个匹配预测框:
其中,fij≥0 i=1,2,...,m,j=1,2,...,n;
其中,所述线性规划方程的约束条件为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011348833.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种接箍件用热轧管坯生产方法
- 下一篇:一种融合权益的资源转移方法和系统