[发明专利]评估目标检测模型的方法和系统在审
申请号: | 202111073590.7 | 申请日: | 2020-05-07 |
公开(公告)号: | CN113850264A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 黄江波 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06F40/279;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估 目标 检测 模型 方法 系统 | ||
本发明提供一种评估目标检测模型的方法和系统。该方法包括:基于目标检测模型,生成表示目标的预测边界框。该目标位于一个或多个相邻目标附近。该方法还包括确定该预测边界框和该目标的真值边界框之间的交集面积,以及确定该预测边界框和该目标的真值边界框之间的修正并集面积。确定修正并集面积包括:基于一个或多个权重,确定预测边界框和真值边界框之间的加权并集面积,将该预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积与加权并集面积相加。该方法进一步包括确定等于所述预测边界框和该目标的真值边界框之间的交集面积除以修正并集面积的分数。该分数代表该目标检测模型的性能。
技术领域
本发明通常涉及用于评估目标检测模型的方法和系统,并且涉及目标检测方法和装置。
背景技术
光学字符识别(Optical Character Recognition,OCR)将打印、手写或印刷的文本图像机械地或电子地转换为机器编码文本,无论该文本图像是来自扫描文档、文档照片、场景照片或叠加在图像上的字幕文本等等。为了识别文本,第一步要检测各文本段的边界框。用于检测文本的算法属于计算机视觉中的“目标检测”的领域。
在目标检测中,交并比(Intersection over Union,IoU)是用于评估检测器和模型选择的准确性的通用标准度量。传统的IoU公式定义为“预测边界框与真值(groundtruth)边界框之间的交集面积除以预测边界框与真值边界框之间的并集面积”。在大多数情况下,此公式都适用。但是,在文本检测的情况下,传统的IoU可能无法选择最佳的模型/参数,因此使用传统的IoU可能会大大降低文本识别的最终准确性。
例如,传统的IoU公式没有考虑至少两种情况,即,(1)传统的IoU没有考虑到交集(intersection)较小以及并集(union)较大均会类似地导致IoU较小,但是,对于文本检测而言,交集较小比并集较大更糟糕,因为这可能会导致文本的某些区域丢失并影响随后的OCR结果;(2)传统的IoU不考虑预测文本框与其他真值文本框之间的交集。如果缺乏对以上两种情况的考虑,即使IoU值更高,模型却不一定更好。
因此,需要提供可以改善用于文本检测的目标检测模型的评估的方法和设备。
发明内容
本公开的第一方面提供了一种用于评估目标检测模型的性能的方法。该方法包括基于所述目标检测模型,生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目标附近;确定所述预测边界框和所述目标的真值边界框之间的交集面积;确定所述预测边界框和所述目标的真值边界框之间的修正并集面积。确定所述修正并集面积包括根据一个或多个权重,确定所述预测边界框和所述真值边界框之间的加权并集面积;以及将所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积加上所述加权并集面积。该方法还包括确定分数,该分数等于所述预测边界框和所述目标的真值边界框之间的交集面积除以所述修正并集面积。该分数代表目标检测模型的性能。
本公开的第二方面提供一种目标检测方法。该方法包括:接收未标记的实际数据和多个目标检测模型,其中,所述多个目标检测模型由神经网络基于标记的训练数据生成;使用第一方面所述的方法,利用验证数据评估每个所述目标检测模型,以识别具有最高分数的所述目标检测模型;以及根据识别出的所述目标检测模型,在所述未标记的实际数据中检测目标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111073590.7/2.html,转载请声明来源钻瓜专利网。