[发明专利]一种基于分割的文本检测方法、装置、系统及介质在审
申请号: | 202110120965.4 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112818985A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 孙悦;李天驰;王帅 | 申请(专利权)人: | 深圳点猫科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 广东良马律师事务所 44395 | 代理人: | 张柯 |
地址: | 518000 广东省深圳市前海深港合作区南山街道兴海大道3044号信*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分割 文本 检测 方法 装置 系统 介质 | ||
本发明公开了一种基于分割的文本检测方法、装置、系统及介质,方法包括:获取待检测文本图像,对所述待检测文本图像中的文本区域进行特征提取后输出字符区域概率图和字符关联概率图;根据所述字符区域概率图和字符关联概率图对所述文本区域进行字符分割后获得每个字符的标注框;将文本区域中各个标注框的坐标转换至待检测文本图像后输出字符文本检测结果。本发明实施例通过挖掘文待检测文本图像中每个字符的区域概率以及字符之间的连接概率来进行字符分割,实现了字符级的文本检测,有效提高了针对不规则形状文本或者过长文本的检测准确性。
技术领域
本发明涉及文本检测技术领域,尤其涉及一种基于分割的文本检测方法、装置、系统及介质。
背景技术
场景文本检测在计算机视觉领域有着广泛的应用,如即时翻译、图像检索、场景解析、地理定位、盲导航等。但是在一些情况下,现有图像文本检测方法可能会受到影响,比如弯曲、变形或非常长的文本,这些文本很难用单个边框来检测,而目前现有的文本检测器针对字符级的检测准确性不够,进而降低了复杂场景文本检测结果的准确性。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种基于分割的文本检测方法、装置、系统及介质,旨在解决现有技术中字符级场景文本检测准确性低的问题。
本发明的技术方案如下:
一种基于分割的文本检测方法,其包括如下步骤:
获取待检测文本图像,对所述待检测文本图像中的文本区域进行特征提取后输出字符区域概率图和字符关联概率图;
根据所述字符区域概率图和字符关联概率图对所述文本区域进行字符分割后获得每个字符的标注框;
将文本区域中各个标注框的坐标转换至待检测文本图像后输出字符文本检测结果。
所述的基于分割的文本检测方法中,所述对所述待检测文本图像中的文本区域进行特征提取后输出字符区域概率图和字符关联概率图之前,还包括:
构建字符文本检测模型,以预设损失函数通过弱监督学习训练所述字符文本检测模型直到模型收敛至预设值后完成训练。
所述的基于分割的文本检测方法中,所述构建字符文本检测模型,以预设损失函数通过弱监督学习训练所述字符文本检测模型直到模型收敛至预设值后完成训练,包括:
构建字符文本检测模型,获取无字符标注的真实样本和具有字符标注的合成样本;
将所述真实样本合成样本均输入至所述字符文本检测模型中进行弱监督学习训练,以预设损失函数对所述字符文本检测模型的输出结果进行误差评价;
将所述输出结果反馈至用于生成合成样本的标注生成器;
所述标注生成器根据输出结果输出更新后的合成样本至所述字符文本检测模型中,直到误差评价结果小于预设值后完成训练。
所述的基于分割的文本检测方法中,所述获取具有字符标注的合成样本,包括:
获取合成图像中每个字符框和关联框的角点以及对应数量的原始高斯热图;
通过透视变换将所述原始高斯热图根据每个字符框的角点转换为对应字符框的形状;
将透视转换后的原始高斯热图按每个字符框的位置覆盖在所述合成图像上,作为合成图像的字符标注。
所述的基于分割的文本检测方法中,所述预设损失函数为,其中,和分别为预测输出的字符区域概率图和字符关联概率图;和分别为合成样本中的字符区域概率图和字符关联概率图,为字符框分割置信度矩阵。
所述的基于分割的文本检测方法中,所述字符框分割置信度矩阵,其中,为字符框分割置信度,为单词级别的标注样例,为边框区域,为标注样例的长度,为分割得到的字符框数量。
所述的基于分割的文本检测方法中,所述字符区域概率图和字符关联概率图均为高斯热图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳点猫科技有限公司,未经深圳点猫科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110120965.4/2.html,转载请声明来源钻瓜专利网。