[发明专利]一种文本检测方法和装置在审

申请号：	202011387915.4	申请日：	2020-12-02
公开（公告）号：	CN112183523A	公开（公告）日：	2021-01-05
发明（设计）人：	谢春鸿	申请（专利权）人：	北京云测信息技术有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/62
代理公司：	北京国昊天诚知识产权代理有限公司 11315	代理人：	许振新
地址：	100016 北京市朝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种文本检测方法和装置，该方法包括：获取包含文本的图片；对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。在得到文本检测结果后，由于可以使用预先训练的分类模型对检测结果中的文本框和非文本框进行分类，因此，可以确定出检测结果中哪些是文本框，哪些是非文本框，从而可以过滤掉其中的非文本框，仅保留文本框，改善文本检测效果；进一步地，在后续进行文本识别时，可以仅基于检测结果中的文本框进行文本识别，从而可以减少文本识别的次数，提高整个文本检测识别过程的效率。

技术领域

本申请涉及文本检测领域，尤其涉及一种文本检测方法和装置。

背景技术

目前，在很多应用场景下，都需要对图片中的文本进行识别，以得到图片中包含的文本。一般地，在对图片中的文本进行识别时，可以基于OCR（Optical CharacterRecognition，光学字符识别）实现。具体地，首先，可以对图片进行文本检测，得到包含文本的文本框，其次，对文本框进行文本识别，进而得到图片中包含的文本。

然而，在实际应用中，在使用OCR对图片进行文本检测时，在图片中包括复杂背景的情况下，检测结果中会包含非文本框，导致文本检测的检测效果不佳，严重影响后续的文本识别。

发明内容

本申请实施例提供一种文本检测方法和装置，用于解决目前在使用OCR对包含复杂背景的图片进行文本检测时，检测效果不佳的问题。

为解决上述技术问题，本申请实施例是这样实现的：

第一方面，提出一种文本检测方法，包括：

获取包含文本的图片；

对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；

基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。

第二方面，提出一种文本检测装置，包括：

获取单元，获取包含文本的图片；

文本检测单元，对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；

分类单元，基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。