[发明专利]文本检测的方法及装置、存储介质及计算机设备在审

专利信息
申请号: 202011071076.5 申请日: 2020-10-09
公开(公告)号: CN112329765A 公开(公告)日: 2021-02-05
发明(设计)人: 高远 申请(专利权)人: 中保车服科技服务股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司: 深圳中细软知识产权代理有限公司 44528 代理人: 袁文英
地址: 518028 广东省深圳市福田区华富街道莲*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 检测 方法 装置 存储 介质 计算机 设备
【说明书】:

发明实施例公开了一种文本检测的方法及装置、存储介质及计算机设备,该方法包括:获取第一图像,第一图像包含目标文本,利用特征提取模块对第一图像进行卷积运算得到相应的特征图,利用特征合并模块对特征图进行合并操作得到目标特征图,目标特征图包括目标文本对应的像素点,通过单通道模块对目标特征图进行卷积运算得到目标分数图,通过多通道模块对目标分数图进行卷积运算得到几何形状图,通过局部感知算法根据几何形状图构造出包含目标文本的目标文本框。通过将文本检测模型中的输出模块包含的单通道模块设置为预设个数的单通道,得到了精确度更高的目标分数图,从而提高了目标文本框的精准度并解决了目标文本框不够匹配的问题。

技术领域

本发明涉及文本检测技术领域,尤其涉及一种文本检测的方法及装置、存储介质及计算机设备。

背景技术

目前光学字符识别OCR(Optical Character Recognition)文本检测识别技术已被各行各业广泛使用,作为具备海量图像数据的保险行业,OCR更是能直接为产业赋能的技能。而文本检测是OCR文本检测识别技术中的重要一环,文本检测模型的性能会直接影响到整个OCR模型的性能。OCR技术中的EAST文本检测模型是一种常用的文本检测模型,由于其检测精度高,速度快的优势受到欢迎,但由于模型自身的特性的缘故也存在一些问题,当待识别图像中两个文本行位置较近时会将其误检为一行或者得到的文本检测框与文本行不够匹配。

发明内容

基于此,有必要针对上述问题,提出一种文本检测的方法及装置、存储介质及计算机设备,本发明目的是通过将文本检测模型中的输出模块包含的单通道模块设置为预设个数的单通道,得到了精确度更高的目标分数图,从而提高了目标文本框的精准度并解决了目标文本框不够匹配的问题。

在第一方面,本申请提供了一种文本检测的方法,所述方法用于文本检测模型,所述文本检测模型包括:特征提取模块、特征合并模块和输出模块,所述输出模块包括单通道模块和多通道模块,所述单通道模块包括预设个数的单通道,所述方法包括:

获取第一图像,所述第一图像包含目标文本;

利用所述特征提取模块对所述第一图像进行卷积运算得到相应的特征图;

利用所述特征合并模块对所述特征图进行合并操作得到目标特征图,所述目标特征图包括所述目标文本对应的像素点;

通过所述单通道模块对所述目标特征图进行卷积运算得到目标分数图;

通过所述多通道模块对所述目标分数图进行卷积运算得到几何形状图;

通过局部感知算法根据所述几何形状图构造出包含所述目标文本的目标文本框。

可选的,所述特征提取模块包括多个并联的卷积层,所述利用所述特征提取模块对所述第一图像进行卷积运算得到相应的特征图,包括:

利用所述多个并联的卷积层分别对所述第一图像进行卷积运算,得到多个不同尺寸的特征图。

可选的,所述利用所述特征合并模块对所述特征图进行合并操作得到目标特征图,包括:

通过反池化的操作对所述多个不同尺寸的特征图进行计算得到所述目标特征图。

可选的,所述通过所述单通道模块对所述目标特征图进行卷积运算得到目标分数图,包括:

通过所述预设个数的单通道对所述目标特征图内缩预设个数的像素点,得到预设个数的内缩后的目标特征图;

对预设个数的所述内缩后的目标特征图进行卷积运算得到预设个数的所述分数图;

根据精确程度从预设个数的所述分数图中筛选出所述目标分数图。

可选的,所述通过所述多通道模块对所述目标分数图进行卷积运算得到几何形状图,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中保车服科技服务股份有限公司,未经中保车服科技服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011071076.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top