[发明专利]一种文本检测方法和装置在审
申请号: | 202011387915.4 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112183523A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 谢春鸿 | 申请(专利权)人: | 北京云测信息技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 100016 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 | ||
本申请公开了一种文本检测方法和装置,该方法包括:获取包含文本的图片;对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。在得到文本检测结果后,由于可以使用预先训练的分类模型对检测结果中的文本框和非文本框进行分类,因此,可以确定出检测结果中哪些是文本框,哪些是非文本框,从而可以过滤掉其中的非文本框,仅保留文本框,改善文本检测效果;进一步地,在后续进行文本识别时,可以仅基于检测结果中的文本框进行文本识别,从而可以减少文本识别的次数,提高整个文本检测识别过程的效率。
技术领域
本申请涉及文本检测领域,尤其涉及一种文本检测方法和装置。
背景技术
目前,在很多应用场景下,都需要对图片中的文本进行识别,以得到图片中包含的文本。一般地,在对图片中的文本进行识别时,可以基于OCR(Optical CharacterRecognition,光学字符识别)实现。具体地,首先,可以对图片进行文本检测,得到包含文本的文本框,其次,对文本框进行文本识别,进而得到图片中包含的文本。
然而,在实际应用中,在使用OCR对图片进行文本检测时,在图片中包括复杂背景的情况下,检测结果中会包含非文本框,导致文本检测的检测效果不佳,严重影响后续的文本识别。
发明内容
本申请实施例提供一种文本检测方法和装置,用于解决目前在使用OCR对包含复杂背景的图片进行文本检测时,检测效果不佳的问题。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出一种文本检测方法,包括:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
第二方面,提出一种文本检测装置,包括:
获取单元,获取包含文本的图片;
文本检测单元,对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
分类单元,基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
第三方面,提出一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,该可执行指令在被执行时使该处理器执行以下操作:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
第四方面,提出一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下方法:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云测信息技术有限公司,未经北京云测信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011387915.4/2.html,转载请声明来源钻瓜专利网。