[发明专利]一种文本检测方法和装置在审
申请号: | 202011387915.4 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112183523A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 谢春鸿 | 申请(专利权)人: | 北京云测信息技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 100016 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 | ||
1.一种文本检测方法,其特征在于,包括:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
2.如权利要求1所述的方法,其特征在于,所述分类模型通过以下方式确定得到:
获取样本图片,所述样本图片中包括已标注的样本文本框和样本非文本框;
提取所述样本图片中的所述样本文本框和所述样本非文本框;
基于所述样本文本框和所述样本非文本框进行学习训练,得到所述分类模型。
3.如权利要求2所述的方法,其特征在于,在基于所述样本文本框和所述样本非文本框进行学习训练之前,所述方法还包括:
对所述样本文本框和所述样本非文本框进行标准化处理,得到具有相同大小的样本文本框和样本非文本框;
对标准化处理后得到的样本文本框和样本非文本框进行数据清洗,得到用于模型训练的样本文本框和样本非文本框。
4.如权利要求3所述的方法,其特征在于,基于所述样本文本框和所述样本非文本框进行学习训练,得到所述分类模型,包括:
构建神经网络模型,所述神经网络模型中包括卷积层、标准化层、池化层、丢弃层和全连接层;
基于所述神经网络模型对数据清洗后的样本文本框和样本非文本框进行学习训练,得到所述分类模型。
5.如权利要求1所述的方法,其特征在于,基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,包括:
将所述检测结果中的文本框和非文本框进行标准化处理,得到具有相同大小的文本框和非文本框;
将标准化处理后得到的文本框和非文本框输入所述分类模型,得到输出结果;
基于所述输出结果对所述检测结果中的文本框和非文本框进行分类。
6.如权利要求5所述的方法,其特征在于,所述输出结果中包括模型输入属于文本框的概率;
其中,基于所述输出结果对所述检测结果中的文本框和非文本框进行分类,包括:
针对所述检测结果中的任一待分类对象,确定与所述待分类对象对应的模型输出结果;
若所述模型输出结果中包括的概率大于或等于预设阈值,则确定所述待分类对象为文本框;
若所述模型输出结果中包括的概率小于所述预设阈值,则确定所述待分类对象为非文本框。
7.如权利要求1所述的方法,其特征在于,在得到文本框和非文本框后,所述方法还包括:
基于分类得到的文本框进行文本识别,得到所述图片中的文本。
8.一种文本检测装置,其特征在于,包括:
获取单元,获取包含文本的图片;
文本检测单元,对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
分类单元,基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
9.一种电子设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,该可执行指令在被执行时使该处理器执行以下操作:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下方法:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云测信息技术有限公司,未经北京云测信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011387915.4/1.html,转载请声明来源钻瓜专利网。