[发明专利]一种倾斜矩形范围框标注方式在审

专利信息
申请号: 202080005609.1 申请日: 2020-03-14
公开(公告)号: CN113056745A 公开(公告)日: 2021-06-29
发明(设计)人: 不公告发明人 申请(专利权)人: 唐锐
主分类号: G06K9/62 分类号: G06K9/62;G06K9/32
代理公司: 暂无信息 代理人: 暂无信息
地址: 442100 湖北省十堰*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 倾斜 矩形 范围 标注 方式
【说明书】:

一种倾斜矩形范围框标注方式,其用于标注的量是“中心点C的坐标、中心点到任意一个顶点D的向量C到D的一个相邻顶点E的向量在E的投影向量与的比例系数”;同时要求与同向,以及从到的夹角只能是顺时针方向或者逆时针方向中的一种。范围框的基本代数表示为(xc,yc,u,v,ρ),其中(xc,yc)为中心点C的坐标,(u,v)为向量的坐标,ρ为向量与的比例系数。又引入了一个量s表示的两个分量是同号或异号,将和表示为(|u|,|v|,s),就可以得到一个范围框仅有一种数值表示的标注方式(xc,yc,|u|,|v|,s,ρ),其中|u|,|v|为坐标的绝对值。该标注方式能够有效避免损失异常,有利于模型训练。

技术领域

发明涉及到计算机视觉中的目标检测和跟踪算法,特别是基于监督学习的目标检测和跟踪算法,属于目标检测和跟踪算法中范围框标注方式的一种。该矩形范围框标注方式可以用于目标检测和跟踪算法的范围框输出、锚点框设置、样本标注。

背景技术

目标检测和跟踪算法具有巨大的价值,一直以来都是热门研究领域。现阶段绝大多数目标检测算法只能支持边平行于图像像素行和列的矩形范围框(后文中称之为正框),其记录的是中心点坐标、宽、高。对于倾斜范围框(后文称之为斜框),目前也有多种标注方式。第一种,记录中心点坐标、宽、高、旋转角,这是非常常见的标注方式。第二种,记录中心点到四边的距离以及旋转角,参考论文《EAST:An Efficient and Accurate Scene TextDetector》。第三种,记录四个顶点坐标,也很常见,优势是可以表示任意四边形,如果用来表示矩形会有三个冗余量。第四种,按顺时针顺序记录矩形四个顶点中的前两个和第二个顶点到第三个顶点的距离,参考论文《R2CNN:Rotational Region CNN for OrientationRobust Scene Text Detection》。第五种,记录斜框的外接正框以及斜框四个顶点与正框四个顶点顺时针方向的偏移量,参考论文《Gliding vertex on the horizontal boundingbox for multi-oriented object detection》。

背景技术的问题

对于正框,缺陷是显而易见的。对于宽高比大、密集排列、朝向任意的目标,该种标注方式会导致交并比(IOU)不能反映真实的情况。尤其是航空影像、卫星影像上容易出现宽高比大、密集排列、朝向任意的目标,比如停车场里的大汽车,港口里停靠的轮船。

对于斜框的第一种标注方式,如果交换w和h的值,再将θ加上或者减去2kπ+π/2,就能够表示同一个范围框。由于同一个范围框有多种不同的数值表示方式,会导致近似范围框之间的数值差异有大大小小多种情况。如果近似范围框之间的数值差异大,对于基于监督分类的方法来说,就是损失函数的取值异常,不利于模型训练。关于该缺陷的更详细情况可以参考论文《SCRDet:Towards More Robust Detection for Small,Cluttered andRotated Objects》。斜框的第二种和第一种本质是一样的,宽高的一半就是中心点离四边的距离,他们有相同的缺陷。

对于斜框的第三种标注方式,也会出现同一个范围框有多种数值表示的情况。避免损失异常的现行方式是按照坐标值排序顶点,然后计算对应顶点之间的差异,详情可以参考论文《DOTA:A Large-scale Dataset for Object Detection in Aerial Images》。这种处理方式也是有问题的,对坐标值排序会改变数值维度间的对应关系,也就是说,在某次损失计算过程中预测向量的第一维对应真值向量的第二维,在另外一次损失计算过程中第一维可能对应第三维。这种对应关系的随机性同样不利于模型训练。斜框的第四种标注方式就是将第三种标注方式表示矩形框时的冗余量去除后的结果,同样会出现同一个范围框有多种数值表示的情况。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于唐锐,未经唐锐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080005609.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top