[发明专利]文本检测方法、装置、设备及存储介质在审
申请号: | 202110005121.5 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112329761A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06K9/38 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;邓海鸿 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 设备 存储 介质 | ||
1.一种文本检测方法,其特征在于,包括:
获取待识别文本图像的初始特征图像,其中,所述待识别文本图像包含有多个文本区域;
将所述初始特征图像经由包含多个通道的预设模型进行特征提取,得到针对所述多个通道的目标特征图像,其中,所述目标特征图像中所述多个通道的第一通道提取的特征信息表征文本区域概率图,所述文本区域概率图指示所述初始特征图像中各像素点属于文本区域的概率,所述多个通道中除所述第一通道以外的所有其他通道提取的总特征信息表征文本区域所对应的像素点的总编码值,相同文本区域对应的像素点的总编码值相同,不同文本区域之间的像素点的总编码值不同;
基于所述文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出所述待识别文本图像中各像素点所对应的特征值,以确定出所述待识别文本图像的多个文本区域。
2.根据权利要求1所述的方法,其特征在于,所述初始特征图像是所述待识别文本图像经由预设网络、特征金字塔增强模块PFEM、卷积操作、反卷积操作后所得到的、与所述待识别文本图像的图像大小相同的特征图像。
3.根据权利要求1所述的方法,其特征在于,所述多个通道中除所述第一通道以外的其他通道提取的表征文本区域所对应的像素点的编码值为0或1;所述总编码值为采用二进制码方式对各所述其他通道提取的编码值进行组合后所得到包含有0和/或1的数串,所述数串的位数与所述其他通道的通道数量相关。
4.根据权利要求3所述的方法,其特征在于,还包括:
对所述文本区域概率图进行二值化处理,得到二值图;
将以二进制码表征的所述总编码值转化为十进制码,得到各像素点对应的十进制值;
其中,所述基于所述文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出所述待识别文本图像中各像素点所对应的特征值,包括:
将所述文本区域概率图对应的二值图中各像素点对应的值,与各像素点的十进制值进行与操作,得到所述待识别文本图像中各像素点所对应的特征值。
5.根据权利要求1所述的方法,其特征在于,还包括:
基于所述待识别文本图像中各像素点所对应的特征值对所述待识别文本图像进行区域划分,以使相同特征值对应的像素点划分至同一文本区域,不相同特征值的像素点划分至不同的文本区域,得到所述待识别文本图像的多个文本区域。
6.根据权利要求1所述的方法,其特征在于,对所述预设模型训练的步骤包括:
获取待训练文本图像;
对所述待训练文本图像的已知文本区域进行标注,以使不同已知文本区域对应的标注值不同,所述标注值采用十进制数值;
将各所述已知文本区域的表征标注值的十进制码转化为二进制码,所述二进制码的数位与所述多个通道中除第一通道以外的其他通道的通道数量相同;
将所述已知文本区域的标注值转化后得到的二进制码对应映射到各所述其他通道上,得到各其他通道对应的编码值,以完成对所述预设模型的训练。
7.一种文本检测装置,其特征在于,包括:
初始特征获取单元,用于获取待识别文本图像的初始特征图像,其中,所述待识别文本图像包含有多个文本区域;
多通道处理单元,用于将所述初始特征图像经由包含多个通道的预设模型进行特征提取,得到针对所述多个通道的目标特征图像,其中,所述目标特征图像中所述多个通道的第一通道提取的特征信息表征文本区域概率图,所述文本区域概率图指示所述初始特征图像中各像素点属于文本区域的概率,所述多个通道中除所述第一通道以外的所有其他通道提取的总特征信息表征文本区域所对应的像素点的总编码值,相同文本区域对应的像素点的总编码值相同,不同文本区域之间的像素点的总编码值不同;
文本区域确定单元,用于基于所述文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出所述待识别文本图像中各像素点所对应的特征值,以确定出所述待识别文本图像的多个文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110005121.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水环境污染溯源系统
- 下一篇:一种高性能三轴联动自动焊接设备的夹持机构