[发明专利]曲形文本识别方法、装置、设备及介质在审
申请号: | 202110461569.8 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113033543A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 易苗;张蓉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06N3/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;杨毅玲 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种曲形文本识别方法、装置、设备及介质,能够提供精确的文本轮廓区域的掩膜图像,进一步执行曲形文本的判断,进行有针对性的拆分,以减少不必要的计算成本,对于弯曲度最大的拟切分点,对临近区域进行二值化分析,以对拆分点进行微调,并尽量减少对同一字符的切分,得到的所述待识别文本均为非扭曲的正常文本,进而将对难识别的曲形文本的识别问题转化为对多个正常文本的识别问题,通过卷积神经网络学习局部特征信息,再基于循环神经网络想学习时序特征,最后利用序列识别层端到端的语音识别策略识别文字序列,提升了识别效果。此外,本发明还涉及区块链技术,识别结果可存储于区块链节点中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种曲形文本识别方法、装置、设备及介质。
背景技术
在场景文本识别中,一个具有挑战性的任务是处理扭曲或者不规则布局的文本,曲形文本在自然场景中很常见,改善扭曲文档图像的OCR(Optical CharacterRecognition,光学字符识别)识别准确率是一项亟需解决的工作。
现有的针对扭曲文档的识别方法大多是先将文档进行矫正再识别,矫正的方法通常包括:
(1)基于硬件的扭曲文档矫正。
该方法通过特质的硬件设备(如结构光源等)扫描纸张的三维形状信息,然后根据三维形状信息对文档图像进行矫正后进行识别。该方法虽然精度高且适用于各张形状,但往往硬件设备昂贵且携带不易。
(2)基于3D(three dimensional)模型重建的文档矫正算法。
该方法从造成文档扭曲的因素(摆放角度、光源方向等)出发对文档进行3D建模,并利用已有的数学知识对扭曲进行矫正。但是,该方法需要清楚得知道造成扭曲的原因。
(3)基于内容切分的文档矫正。
该方法是直接通过分析文档图像的倾斜角、文本行特征等的扭曲矫正算法。但是,可矫正文档对象有限,且会大幅度增加额外计算成本高,难以实际部署应用,且在图像矫正的过程中虽然可以一定程度上缓解图片中文本行的扭曲分布,但是在映射的计算过程中也会导致文字的变形,带来新的识别问题。
发明内容
鉴于以上内容,有必要提供一种曲形文本识别方法、装置、设备及介质,能够首先通过卷积神经网络学习局部特征信息,再基于循环神经网络想学习时序特征,最后利用序列识别层端到端的语音识别策略识别文字序列,提升了识别效果。
一种曲形文本识别方法,所述曲形文本识别方法包括:
响应于文本识别指令,根据所述文本识别指令获取待检测图像;
利用DBNet算法对所述待检测图像进行文本检测,得到至少一个文本区域的掩膜图像;
基于轮廓分析检测所述掩膜图像中的曲形文本及非曲形文本;
识别所述曲形文本中每个曲形文本的拟切分点;
基于区域划分调整每个曲形文本的拟切分点,得到每个曲形文本的目标切分点;
根据每个曲形文本的目标切分点切分对应的曲形文本,得到至少一个子文本;
组合所述至少一个子文本及所述非曲形文本,得到待识别文本;
利用配置网络对所述待识别文本进行文本识别,得到识别结果。
根据本发明优选实施例,所述根据所述文本识别指令获取待检测图像包括:
解析所述文本识别指令的方法体,得到所述文本识别指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110461569.8/2.html,转载请声明来源钻瓜专利网。