[发明专利]文本检测方法、装置、电子设备及存储介质在审
申请号: | 202010387120.7 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111723841A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 雷军;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种文本检测方法、装置、电子设备及存储介质。文本检测方法包括:将待检测文本图像输入预先训练的文本检测模型,文本检测模型包括特征提取网络和预测网络,特征提取网络包括依次连接的多个特征提取单元;利用当前特征提取单元对自身的输入图像对应的多个不同尺度的特征图进行卷积计算,及按照所述特征图各自对应的权重进行加权融合,得到当前特征提取单元输出的卷积特征图;利用预测网络对多个特征提取单元输出的卷积特征图进行特征融合和分割预测,输出多个预测特征图;对所述多个预测特征图进行后处理,得到所述待检测文本图像对应的文本检测结果。本发明能够减少文本检测过程中的漏检及误合并现象,提高及文本检测的准确率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种文本检测方法、装置、电子设备及存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)是通过图像处理和模式识别技术对光学的字符进行识别的意思,是自动识别技术研究和应用领域中的一个重要方面。文本识别分为两个步骤:文本的检测和文本的识别。文本检测是前期比较重要的一个环节,文本检测算法的准确度对于文本识别整体的识别率影响很大。
在文本检测这一领域,目前学界和工业界都开源了很多相关的算法。但是通过在应用场景实践中发现,现有算法在文本检测任务中效果表现得并不好,产生很多漏检的现象,导致文本检测的准确率较低。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种文本检测方法、装置、电子设备及存储介质。
第一方面,本发明实施例公开了一种文本检测方法,所述方法包括:
将待检测文本图像输入预先训练的文本检测模型;所述文本检测模型包括特征提取网络和预测网络,所述特征提取网络包括依次连接的多个特征提取单元;
利用当前特征提取单元对自身的输入图像对应的多个不同尺度的特征图进行卷积计算,及按照所述特征图各自对应的权重进行加权融合,得到当前特征提取单元输出的卷积特征图;
利用所述预测网络对所述多个特征提取单元输出的卷积特征图进行特征融合和分割预测,输出多个预测特征图;
对所述多个预测特征图进行后处理,得到所述待检测文本图像对应的文本检测结果。
可选地,第一个特征提取单元的输入图像为所述待检测文本图像;从第二个特征提取单元开始,当前特征提取单元的输入图像为上一个特征提取单元输出的卷积特征图。
可选地,所述卷积特征图的数量小于等于4,所述预测特征图的数量小于等于6。
可选地,所述文本检测模型通过如下方式训练:
获取样本图像和所述样本图像的标注文本区域,并对所述样本图像进行不同比例的缩放处理,得到多个样本目标预测特征图和各样本目标预测特征图的标注文本区域;
将所述样本图像输入待训练模型;所述待训练模型包括待训练特征提取网络和待训练预测网络,所述待训练特征提取网络包括依次连接的多个待训练特征提取单元;
利用当前待训练特征提取单元对自身的输入图像对应的多个不同尺度的特征图进行卷积计算,及按照所述特征图各自对应的权重进行加权融合,得到当前待训练特征提取单元输出的样本卷积特征图;
利用所述待训练预测网络对所述多个待训练特征提取单元输出的样本卷积特征图进行特征融合和分割预测,输出多个样本预测特征图;
基于所述多个样本预测特征图,以及所述多个样本目标预测特征图和各样本目标预测特征图的标注文本区域,确定是否训练完成,将训练完成的模型作为所述文本检测模型。
第二方面,本发明实施例公开了一种文本检测装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010387120.7/2.html,转载请声明来源钻瓜专利网。