[发明专利]文本字符检测方法、装置及存储介质在审
申请号: | 202010941178.1 | 申请日: | 2020-09-09 |
公开(公告)号: | CN114241184A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 徐汉飞;朴安妮;马佳炯 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V30/148;G06V10/772;G06V10/764 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 官建红 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 字符 检测 方法 装置 存储 介质 | ||
本申请公开了一种文本字符检测方法、装置及存储介质,该文本字符检测方法包括:获取待识别文本图像;对待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本;根据预置的字符字典中字符的字符编码信息,确定检测文本是正向文本还是倒置文本,并输出检测文本的正向文本。本申请可以实现对文本方向的判定以及输出检测文本对应的正向文本的内容识别结果,不论待识别文本图像识别后的多个字符是正向还是倒置,均可以完成识别,从而实现双向文本的识别,拓展文本识别的使用场景,以及提高文本在复杂场景下的识别准确率。
技术领域
本发明涉及通信技术领域,具体涉及一种文本字符检测方法、装置及存储介质。
背景技术
目前,基于深度学习的文本识别任务已经较为成熟,但是文本识别通常环节都是先通过文本检测检测出文本区域,再确定文本的方向,进行识别,或者事先已知文本识别的方向为正向,对于整个文本区域旋转180度的倒置文本,如果直接使用常规的文字识别方案,难以得到正确的识别结果。
自然场景或者工业环境中的文本识别方案会比文件、证件等事先确定了文本的方向或者可以得到文本方向的理想情况复杂很多,例如快递传输行业在中转场准运包裹的环节中需要使用文本识别技术对包裹上粘贴的运单中的文字信息进行识别,而这一场景下,由于包裹的摆放位置不固定,运单的粘贴位置和方向不固定,导致进行文本识别的图片的方向也不固定,由于每个样本差异较大,检测算法也只能根据文字的排列规律有效判断文本的横纵方向,无法判断文本的正反,从而导致此类文本无法正常识别。
发明内容
本发明提供一种文本字符检测方法、装置及存储介质,可以实现对文本方向的判定以及识别文本对应的正向文本的内容识别结果,不论待识别文本图像识别后的多个字符是正向还是倒置,均可以完成识别,从而实现双向文本的识别,拓展文本识别的使用场景,以及提高文本在复杂场景下的识别准确率。
一方面,本申请提供一种文本字符检测方法,所述文本字符检测方法包括:
获取待识别文本图像;
对所述待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本;
根据预置的字符字典中字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本;
其中,所述字符字典中的字符的字符编码信息包括预置的字符集合中预先定义的第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息,所述第一类型字符为字符的正向字符和其倒置字符不同的字符,所述第二类型字符为字符的倒置字符与字符集合中其他字符的正向字符相似的字符或者为字符的正向字符与字符字典中其他字符的倒置字符相似的字符,所述第三类型字符为字符的正向字符和其倒置字符相同的字符,所述第四类型字符为字符的倒置字符和字符集合中其他字符的正向字符相同的字符;所述第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息包括预先设置的正向字符编码、倒置字符编码和公共字符编码的信息,所述正向字符编码信息为所述第一类型字符和第二类型字符的正向字符的字符编码信息,所述倒置字符编码信息为所述第一类型字符和第二类型字符的倒置字符的字符编码信息,所述公共字符编码信息为第三类型字符或第四类型字符的字符编码信息,所述第三类型字符中每个字符及其对应的字符采用相同的字符编码信息,所述第四类型字符中每个字符及其对应的字符采用相同的字符编码信息。
在本申请一些实施方式中,在所述根据预置的字符字典中字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本之前,所述方法还包括:
获取初始字符集合,所述初始字符集合为包括预设数量的正向字符的字符集合,且所述初始字符集合中的字符仅包括正向字符;
对所述初始字符集合中的字符进行倒置后,添加到所述初始字符集合中,得到所述字符集合;
对所述字符集合中字符进行编码,得到所述字符字典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010941178.1/2.html,转载请声明来源钻瓜专利网。