[发明专利]图像文本检测半自动标注方法、系统、计算机设备及介质有效
申请号: | 202110906651.7 | 申请日: | 2021-08-09 |
公开(公告)号: | CN113807336B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 黄双萍;刘宗昊;王庆丰 | 申请(专利权)人: | 华南理工大学;人工智能与数字经济广东省实验室(广州) |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V10/82 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文本 检测 半自动 标注 方法 系统 计算机 设备 介质 | ||
本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。
技术领域
本发明涉及一种图像文本检测半自动标注方法、系统、计算机设备及存储介质,属于人工智能技术领域、OCR领域。
背景技术
随着人工智能技术的发展,文本检测技术作为一项基础的计算机视觉任务得到了较大发展。文本检测指的是定位一张图像中的文本区域,该技术可广泛应用于无人驾驶、机器人导航、盲人辅助等行业中。随着深度学习等大数据驱动的机器学习算法在包括自然语言处理,计算机视觉,语音识别等领域内取得巨大成功,基于深度学习的图像文本检测技术也得到较大发展,图像文本检测算法的性能显著提升。然而,这些方法依赖大量的检测标注数据。
到目前为止,检测标注数据的获得基本依赖人工,耗时耗力且昂贵。尤其对于不规则的文本区域位置,通常需要比较多的点数才能标注,效率极低,且因人为主观性导致精度较低。为此,需要半自动或者自动标注算法代替人工标注方法,提高标注效率和精准度。自动算法到目前为止都是采用检测算法完成,即所谓的预标注。由于检测算法性能受限,用检测算法预标注的自动算法尚不能产生高质量标注,仍需较多人工校验才能得到真正可用的标注,没有实质性解决图像文本检测标注难题。
发明内容
有鉴于此,本发明提供了一种图像文本检测半自动标注方法、系统、计算机设备及存储介质,其能够提高文本检测标注效率和标注效果。
本发明的第一个目的在于提供一种图像文本检测半自动标注方法。
本发明的第二个目的在于提供一种图像文本检测半自动标注系统。
本发明的第三个目的在于提供一种计算机设备。
本发明的第四个目的在于提供一种存储介质。
本发明的第一个目的可以通过采取如下技术方案达到:
一种图像文本检测半自动标注方法,所述方法包括:
获取文本图像;
从文本图像中获取文本中心线,所述文本中心线是一条贯穿文本中心的弯曲折线,由依次连接K+1个点构成K条直线段构成;
生成N个围绕文本中心线的候选边界框,每个候选边界框是一个多边形区域轮廓,围成N个候选文本区域;
将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;
将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;
通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;
将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。
进一步的,所述生成N个围绕文本中心线的候选边界框,具体包括:
确定K+1条法线,每条法线ni与文本中心线相交于点ci,同时与文本中心线在点ci的切线垂直;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;人工智能与数字经济广东省实验室(广州),未经华南理工大学;人工智能与数字经济广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110906651.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序