[发明专利]曲形文本识别方法、装置、设备及介质在审

申请号：	202110461569.8	申请日：	2021-04-27
公开（公告）号：	CN113033543A	公开（公告）日：	2021-06-25
发明（设计）人：	易苗;张蓉	申请（专利权）人：	中国平安人寿保险股份有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/46;G06N3/04
代理公司：	深圳市赛恩倍吉知识产权代理有限公司 44334	代理人：	刘丽华;杨毅玲
地址：	518000 广东省深圳市福田区益田路503***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能领域，提供一种曲形文本识别方法、装置、设备及介质，能够提供精确的文本轮廓区域的掩膜图像，进一步执行曲形文本的判断，进行有针对性的拆分，以减少不必要的计算成本，对于弯曲度最大的拟切分点，对临近区域进行二值化分析，以对拆分点进行微调，并尽量减少对同一字符的切分，得到的所述待识别文本均为非扭曲的正常文本，进而将对难识别的曲形文本的识别问题转化为对多个正常文本的识别问题，通过卷积神经网络学习局部特征信息，再基于循环神经网络想学习时序特征，最后利用序列识别层端到端的语音识别策略识别文字序列，提升了识别效果。此外，本发明还涉及区块链技术，识别结果可存储于区块链节点中。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种曲形文本识别方法、装置、设备及介质。

背景技术

在场景文本识别中，一个具有挑战性的任务是处理扭曲或者不规则布局的文本，曲形文本在自然场景中很常见，改善扭曲文档图像的OCR(Optical CharacterRecognition，光学字符识别)识别准确率是一项亟需解决的工作。

现有的针对扭曲文档的识别方法大多是先将文档进行矫正再识别，矫正的方法通常包括：

(1)基于硬件的扭曲文档矫正。

该方法通过特质的硬件设备(如结构光源等)扫描纸张的三维形状信息，然后根据三维形状信息对文档图像进行矫正后进行识别。该方法虽然精度高且适用于各张形状，但往往硬件设备昂贵且携带不易。

(2)基于3D(three dimensional)模型重建的文档矫正算法。

该方法从造成文档扭曲的因素(摆放角度、光源方向等)出发对文档进行3D建模，并利用已有的数学知识对扭曲进行矫正。但是，该方法需要清楚得知道造成扭曲的原因。

(3)基于内容切分的文档矫正。

该方法是直接通过分析文档图像的倾斜角、文本行特征等的扭曲矫正算法。但是，可矫正文档对象有限，且会大幅度增加额外计算成本高，难以实际部署应用，且在图像矫正的过程中虽然可以一定程度上缓解图片中文本行的扭曲分布，但是在映射的计算过程中也会导致文字的变形，带来新的识别问题。

发明内容