[发明专利]图像文本检测半自动标注方法、系统、计算机设备及介质有效

专利信息
申请号: 202110906651.7 申请日: 2021-08-09
公开(公告)号: CN113807336B 公开(公告)日: 2023-06-30
发明(设计)人: 黄双萍;刘宗昊;王庆丰 申请(专利权)人: 华南理工大学;人工智能与数字经济广东省实验室(广州)
主分类号: G06V30/14 分类号: G06V30/14;G06V10/82
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李君
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 文本 检测 半自动 标注 方法 系统 计算机 设备 介质
【说明书】:

发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。

技术领域

本发明涉及一种图像文本检测半自动标注方法、系统、计算机设备及存储介质,属于人工智能技术领域、OCR领域。

背景技术

随着人工智能技术的发展,文本检测技术作为一项基础的计算机视觉任务得到了较大发展。文本检测指的是定位一张图像中的文本区域,该技术可广泛应用于无人驾驶、机器人导航、盲人辅助等行业中。随着深度学习等大数据驱动的机器学习算法在包括自然语言处理,计算机视觉,语音识别等领域内取得巨大成功,基于深度学习的图像文本检测技术也得到较大发展,图像文本检测算法的性能显著提升。然而,这些方法依赖大量的检测标注数据。

到目前为止,检测标注数据的获得基本依赖人工,耗时耗力且昂贵。尤其对于不规则的文本区域位置,通常需要比较多的点数才能标注,效率极低,且因人为主观性导致精度较低。为此,需要半自动或者自动标注算法代替人工标注方法,提高标注效率和精准度。自动算法到目前为止都是采用检测算法完成,即所谓的预标注。由于检测算法性能受限,用检测算法预标注的自动算法尚不能产生高质量标注,仍需较多人工校验才能得到真正可用的标注,没有实质性解决图像文本检测标注难题。

发明内容

有鉴于此,本发明提供了一种图像文本检测半自动标注方法、系统、计算机设备及存储介质,其能够提高文本检测标注效率和标注效果。

本发明的第一个目的在于提供一种图像文本检测半自动标注方法。

本发明的第二个目的在于提供一种图像文本检测半自动标注系统。

本发明的第三个目的在于提供一种计算机设备。

本发明的第四个目的在于提供一种存储介质。

本发明的第一个目的可以通过采取如下技术方案达到:

一种图像文本检测半自动标注方法,所述方法包括:

获取文本图像;

从文本图像中获取文本中心线,所述文本中心线是一条贯穿文本中心的弯曲折线,由依次连接K+1个点构成K条直线段构成;

生成N个围绕文本中心线的候选边界框,每个候选边界框是一个多边形区域轮廓,围成N个候选文本区域;

将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;

将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;

通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;

将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。

进一步的,所述生成N个围绕文本中心线的候选边界框,具体包括:

确定K+1条法线,每条法线ni与文本中心线相交于点ci,同时与文本中心线在点ci的切线垂直;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;人工智能与数字经济广东省实验室(广州),未经华南理工大学;人工智能与数字经济广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110906651.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top