[发明专利]文本识别方法、装置、电子设备及存储介质在审
申请号: | 202011521439.0 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112541494A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 胡鹏;黄光伟 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种文本识别方法、装置、电子设备及存储介质,该方法包括获取待识别文本图像;基于预先构建的文本检测网络,提取待识别文本图像的特征图,并对经过融合的特征图进行文字像素分类,生成至少一个候选文本框,其中文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,第二特征提取层上采样第一特征提取层的输出结果,第三特征提取层下采样第二特征提取层的输出结果;根据预设目标文本格式,筛选候选文本框得到目标文本框,并对目标文本框进行识别,得到识别结果。基于此,本申请能够同时利用低层特征的高分辨率信息以及高层特征的高语义信息,使得文本像素位置检测更加精确,提升了文本识别准确度和效率。
技术领域
本申请一般涉及图像处理技术领域,具体涉及一种文本识别方法、装置、电子设备及存储介质。
背景技术
智能取餐柜又称配送点餐系统,主要用于储存快餐食物,方便了人们的日常生活。实际使用时,智能取餐柜可以通过按键和扫描取餐码等方式对用户身份进行验证,从而完成取餐。
在实现本发明的过程中,发明人发现相关技术识别取餐码的准确度低,尤其是当取餐码上存在旋转或者弯曲角度的文本时,误差更大,同时检测所消耗的时间长。
发明内容
鉴于相关技术中的上述缺陷或不足,期望提供一种文本识别方法、装置、电子设备及存储介质,能够提升文本识别准确度和效率。
第一方面,本申请提供一种文本识别方法,所述方法包括:
获取待识别文本图像;
基于预先构建的文本检测网络,提取所述待识别文本图像的特征图,并对经过融合的所述特征图进行文字像素分类,生成至少一个候选文本框,其中所述文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,所述第二特征提取层上采样所述第一特征提取层的输出结果,所述第三特征提取层下采样所述第二特征提取层的输出结果;
根据预设目标文本格式,筛选所述候选文本框得到目标文本框,并对所述目标文本框进行识别,得到识别结果。
可选地,在本申请一些实施例中,所述方法还包括:
对所述第一特征提取层的输出结果进行残差特征增强处理,得到比率不变的上下文信息。
可选地,在本申请一些实施例中,所述根据预设目标文本格式,筛选所述候选文本框得到目标文本框,包括:
获取所述目标文本格式中字符类型和数目;
遍历所述候选文本框中的字符,确定与所述字符类型和数目均相同的文本框作为所述目标文本框。
可选地,在本申请一些实施例中,所述方法还包括:
检测所述候选文本框的宽高比例,若所述宽高比例与第一预设阈值不同,则滤除所述候选文本框;和/或,
检测所述候选文本框中文字像素的数目,若所述文字像素的数目与第二预设阈值不同,则滤除所述候选文本框。
可选地,在本申请一些实施例中,所述方法还包括:
计算所述目标文本框的边缘和角点;
当所述边缘和角点存在形变时,校正所述目标文本框得到标准文本框。
可选地,在本申请一些实施例中,所述对所述目标文本框进行识别,得到识别结果,还包括:
根据预设目标码格式,对所述目标文本框中的字符进行识别,得到所述识别结果。
可选地,在本申请一些实施例中,所述根据预设目标码格式,对所述目标文本框中的字符进行识别,得到所述识别结果,包括:
获取所述目标码格式中字符字体和位置顺序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011521439.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:推荐评论生成方法、装置、设备和介质
- 下一篇:摄像模组和电子设备