[发明专利]一种基于文本中心区域扩增的藏汉双语场景文本检测方法有效
申请号: | 202011550287.7 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112528997B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 王维兰;李金成;郝玉胜;王铁君;李巧巧 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V10/80;G06V10/764;G06V10/82 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 方亚兵 |
地址: | 730030 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 中心 区域 扩增 双语 场景 检测 方法 | ||
本发明公开了一种基于文本中心区域扩增的藏汉双语场景文本检测方法,该方法包括:采用可视化工具对数据进行标注,基于改进人工合成图像的方法生成藏汉双语场景文本图像,构建藏汉双语场景文本检测数据库;对生成的藏汉双语场景文本图像进行检测,确定文本区域在场景图像中的具体位置;通过预测文本区域、文本中心区域以及文本中心区域边界到完整文本实例边界的距离,从文本中心区域开始扩增,最终获取文本实例。实验结果表明,本发明提出的模型能够以75.47%的准确率检测出测试集中的双语文本,获得较好的检测性能,为藏汉双语场景文本检测与识别奠定了基础。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种基于文本中心区域扩增的藏汉双语场景文本检测方法。
背景技术
自然场景是指我们日常生活的环境,包括室内和户外环境。很多场景中含有丰富的文字信息,这对理解自然场景图像有着十分重要的作用。随着智能科技的飞速发展,许多应用场合都需要利用场景中丰富的文字信息,例如自动驾驶、交通监控和智慧城市建设等。而对于场景中的文字,其文字类型不一、光照不同、背景复杂、形状多样、尺度多变、容易受物理因素的影响,使得检测和识别难度远大于传统的扫描文档图像。场景文字检测是判断拍摄的图像中是否有文本实例的过程,是场景文本分析与处理的基石。
在中国藏区,日常文字信息几乎都包含藏文和汉文,比如广告牌、宣传栏、路牌、商店名称等。目前还没有藏汉双语场景文本检测的研究成果。传统方法主要是基于连通域和纹理信息,最典型的方法有基于笔画宽度变换(SWT)的方法,该方法把有着相似笔画宽度的位置都被聚合成文本行,再将文本行切分成一个个字符;基于最大稳定极值区域(MSER)的方法,该方法首先提取最大稳定极值区域,然后对每个MSER的形状和颜色特征使用SVM进行分类获得检测字符。这些方法依赖所设计的特征,只适应较简单的场景,其准确性和鲁棒性等方面无法与基于深度学习的方法相比。
因此为了适应藏汉双语场景文本检测任务,亟需一种双语场景文本检测方法。
发明内容
为了适应藏汉双语场景文本检测任务,本发明利用人工标注和自动合成的方法构建藏汉双语场景文本检测数据库,用来训练网络并评估我们的方法对藏汉双语场景文本检测的性能。
为实现上述目的,本发明提供了如下方案:
一种基于文本中心区域扩增的藏汉双语场景文本检测方法,包括以下步骤:
S1、构建数据集,采用可视化工具对数据进行标注,基于改进人工合成图像的方法生成藏汉双语场景文本图像,构建藏汉双语场景文本检测数据库;
S2、对生成的藏汉双语场景文本图像进行检测,确定文本区域在场景图像中的具体位置;
S3、通过预测文本区域、文本中心区域以及文本中心区域边界到完整文本实例边界的距离,从文本中心区域开始扩增,最终获取文本实例。
优选地,所述步骤S1中构建数据集的具体步骤为:将从藏区拍摄到的真实样本,采用可视化标注工具,对所述样本进行文本行标注,并改进现有合成图像的算法合成带有文本标注信息的场景文本图像,构建藏汉双语场景文本检测数据库。
优选地,对文本行进行标注的方法为四边形标注,包括以下步骤:
S1.1、用四边形框选出图像中的文本实例,使所框选区域的背景减少;
S1.2、记录每个框内文本行的内容;
S1.3、为每张已标记的图像生成json格式的标签文件,将其转成txt文件。
优选地,采用改进的人工合成图像的方法,对所述生成的带有标注信息的藏汉场景文本图像进行合成,合成方法包括以下步骤:
S1.11、收集不含文字的自然场景作为背景图像,利用若干个藏汉双语词条作为文本语料,将常用的藏、汉字体作为渲染文字的字体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011550287.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于LOO-CV验证的交叉核验方法
- 下一篇:辅助康复机器人