[发明专利]基于CTC损失的OCR校正方法、装置、计算机设备和存储介质在审
申请号: | 202210150555.9 | 申请日: | 2022-02-18 |
公开(公告)号: | CN114529902A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 索红亮;郭建京;周忠诚;黄九鸣;张圣栋 | 申请(专利权)人: | 湖南星汉数智科技有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/148 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市高新开发区青山*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ctc 损失 ocr 校正 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及人工智能图像文字识别技术领域,提供了一种基于CTC损失的OCR校正方法、装置、计算机设备和存储介质,所述方法包括:提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵;从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合;遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符的可能值,构建字符串序列,得到字符串序列集合;从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果。采用本方法能够提高OCR识别的准确率。
技术领域
本发明属于人工智能图像文字识别技术领域,尤其涉及一种基于CTC损失的OCR校正方法、装置、计算机设备和存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)是计算机视觉研究领域的分支之一,本质是图像识别。具体来讲就是一种利用扫描仪或者数码相机等电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件建议不编辑加工的技术。
目前来说,简单环境下比如PDF(Portable Document Format,便携式文档格式)图像、网络截图的OCR识别准确度已经比较高了。但是实际社会生活中对复杂环境下的OCR识别有着越来越多的应用需求。然而,在证件、票据拍照等复杂环境下,因字体打印模糊,拍照局部高亮,实体磨损皱褶等因素,OCR识别的准确率还是有所下降。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高OCR识别准确率的基于CTC损失的OCR校正方法、装置、计算机设备和存储介质。
本发明提供一种基于CTC损失的OCR校正方法,包括:
提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵;
从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合;
遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符的可能值,构建字符串序列,得到字符串序列集合;
从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果。
在其中一个实施例中,所述提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵,包括:
对待检测图像中的文字框进行检测和截取,得到待识别文本;
利用基于CTC损失的OCR字符识别模型对所述待识别文本进行字符识别,获取CTC解码字符序列以及所述CTC解码字符序列中各字符的可能值;
根据所述CTC解码字符序列的长度以及各所述字符的可能值,构建CTC解码字符序列矩阵。
在其中一个实施例中,所述从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合,包括:
将所述CTC解码字符序列矩阵中各字符第一可能值的置信度,分别与所述字符可信度阈值进行大小比较,确定字符是否正确;
当所述字符正确时用可信模式字符表示所述字符,不正确时用不可信模式字符表示所述字符,构建所述CTC解码字符序列矩阵对应的模式字符序列;
根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合;所述可信子序列由可信模式字符组成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南星汉数智科技有限公司,未经湖南星汉数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210150555.9/2.html,转载请声明来源钻瓜专利网。