[发明专利]文本区域的确定方法、装置、设备及可读存储介质有效
申请号: | 202110274178.5 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113076814B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 石世昌;黄飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/14;G06V30/146;G06V30/18;G06V30/19;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 区域 确定 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种文本区域的确定方法、装置、设备及可读存储介质,涉及机器学习领域。该方法包括:获取目标图像;对目标图像进行文本识别,得到区域中心预测结果和区域边缘预测结果;对区域中心预测结果和区域边缘预测结果进行逻辑结合,得到目标图像中的文本连通区域;基于文本连通区域确定文本内容在目标图像中的文本区域。在对图像进行文本识别时,同时识别得到用于表示文本区域的中心预测结果和用于表示边缘的边缘预测结果,从而通过对中心预测结果和边缘预测结果的逻辑结合对文本区域的预测进行修正,并最终得到文本区域,在两层检测结果的优化下,文本区域的检测准确率较高,从而后续基于文本区域进行文本内容处理的效率和准确率也较高。
技术领域
本申请实施例涉及机器学习领域,特别涉及一种文本区域的确定方法、装置、设备及可读存储介质。
背景技术
光学字符识别(Optical Character Recognition,OCR)是一种对图像中的字符进行识别的功能。通常,用户将带有字符的图像输入到光学字符识别模块,并得到输出结果。该输出结果中包括识别得到的图像中的字符。OCR技术可以应用于图像转档中,而在图像转档场景下,在OCR识别之前首先需要对图像中的存在文本的区域进行检测。
相关技术中,在文本区域的检测过程中,通常采用神经网络模型直接预测文本区域的信息,如:基于分割的文本行检测方法(pixel-link)是通过预测每个像素是否属于文本区域,然后根据像素之间的关系对文本区域进行合并后,检测得到文本区域的。
然而,上述方式中,基于分割的文字检测方案检测准确率较低,容易出现虚警的问题,故检测得到结果后的后续处理过程较为复杂,导致文本区域的检测准确率低,从而文本内容处理的效率低。
发明内容
本申请实施例提供了一种文本区域的确定方法、装置、设备及可读存储介质,能够提高文本区域的检测准确率以及效率。所述技术方案如下:
一方面,提供了一种文本区域的确定方法,所述方法包括:
获取目标图像,所述目标图像中包括文本内容,所述目标图像为所述文本内容所在的文本区域待确定的图像;
对所述目标图像进行文本识别,得到区域中心预测结果和区域边缘预测结果,所述区域中心预测结果表示预测得到的所述文本区域所处的区域范围,所述区域边缘预测结果表示预测得到的所述文本区域的边缘位置;
对所述区域中心预测结果和所述区域边缘预测结果进行逻辑结合,得到所述目标图像中的文本连通区域,所述文本连通区域表示具有连通关系的所述文本内容在所述目标图像中的区域;
基于所述文本连通区域确定所述文本内容在所述目标图像中的所述文本区域。
另一方面,提供了一种文本区域的确定装置,所述装置包括:
获取模块,用于获取目标图像,所述目标图像中包括文本内容,所述目标图像为所述文本内容所在的文本区域待确定的图像;
识别模块,用于对所述目标图像进行文本识别,得到区域中心预测结果和区域边缘预测结果,所述区域中心预测结果表示预测得到的所述文本区域所处的区域范围,所述区域边缘预测结果表示预测得到的所述文本区域的边缘位置;
处理模块,用于对所述区域中心预测结果和所述区域边缘预测结果进行逻辑结合,得到所述目标图像中的文本连通区域,所述文本连通区域表示具有连通关系的所述文本内容在所述目标图像中的区域;
确定模块,用于基于所述文本连通区域确定所述文本内容在所述目标图像中的所述文本区域。
在一个可选的实施例中,所述处理模块,包括:
生成单元,用于基于所述区域中心预测结果生成区域二值图;
所述生成单元,还用于基于所述区域边缘预测结果生成边缘二值图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110274178.5/2.html,转载请声明来源钻瓜专利网。