[发明专利]基于概率校准的文字识别方法、装置、计算机设备及介质在审
申请号: | 202110735014.8 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113420689A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 洪振厚;王健宗;瞿晓阳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 概率 校准 文字 识别 方法 装置 计算机 设备 介质 | ||
本申请属于人工智能技术领域,本申请提供了一种基于概率校准的文字识别方法、装置、计算机设备及计算机可读存储介质。本申请通过获取初始识别图像,并将初始识别图像输入至预设DARTS模型,对初始识别图像进行文字识别,得到初始识别图像所包含文字的校准参数,将初始识别图像输入至预设OCR模型,对初始识别图像进行文字识别,得到初始识别图像包含的文字对应的文字识别Logits概率化向量,根据校准参数,将文字识别Logits概率化向量进行概率校准并进行归一化处理,得到初始识别图像所包含文字的文字识别结果,通过增加文字识别概率的校准,能够解决识别错误率的校准问题,提高文字识别中字符预测的准确性。
技术领域
本申请涉及人工智能技术领域,尤其涉及图像检测技术领域,具体涉及一种基于概率校准的文字识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
对于OCR(英文为Optical Character Recognition,光学字符识别),较多的应用场景为各种证件的信息提取,例如在提供的证件上获取证件上的姓名,很多场景中,能够正确地识别证件上的姓名,可以极大的简化业务流程,提高效率,也能够防止造假,杜绝假信息。
光学文本识别字符的准确性虽然不断提高,但是,识别字符的错误持续存在,因此确定何时何处发生识别错误,并对发生的文字识别错误进行纠正至关重要。但传统分类器(例如SVM)中,并未实现对发生的文字识别错误进行自动纠正。
发明内容
本申请提供了一种基于概率校准的文字识别方法、装置、计算机设备及计算机可读存储介质,能够解决传统技术中对发生的文字识别错误未进行自动校准的技术问题。
第一方面,本申请提供了一种基于概率校准的文字识别方法,包括:获取初始识别图像,并将所述初始识别图像输入至预设DARTS模型,对所述初始识别图像进行文字识别,得到所述初始识别图像所包含文字的校准参数;将所述初始识别图像输入至预设OCR模型,对所述初始识别图像进行文字识别,得到所述初始识别图像包含的文字对应的文字识别Logits概率化向量;根据所述校准参数,将所述文字识别Logits概率化向量进行概率校准并进行归一化处理,得到所述初始识别图像所包含文字的文字识别结果。。
第二方面,本申请还提供了一种基于概率校准的文字识别装置,包括:第一识别单元,用于获取初始识别图像,并将所述初始识别图像输入至预设DARTS模型,对所述初始识别图像进行文字识别,得到所述初始识别图像所包含文字的校准参数;第二识别单元,用于将所述初始识别图像输入至预设OCR模型,对所述初始识别图像进行文字识别,得到所述初始识别图像包含的文字对应的文字识别Logits概率化向量;校准识别单元,用于根据所述校准参数,将所述文字识别Logits概率化向量进行概率校准并进行归一化处理,得到所述初始识别图像所包含文字的文字识别结果。
第三方面,本申请还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现所述基于概率校准的文字识别方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行所述基于概率校准的文字识别方法的步骤。
本申请提供了一种基于概率校准的文字识别方法、装置、计算机设备及计算机可读存储介质。本申请通过获取初始识别图像,并将所述初始识别图像输入至预设DARTS模型,对所述初始识别图像进行文字识别,得到所述初始识别图像所包含文字的校准参数,将所述初始识别图像输入至预设OCR模型,对所述初始识别图像进行文字识别,得到所述初始识别图像包含的文字对应的文字识别Logits概率化向量,根据所述校准参数,将所述文字识别Logits概率化向量进行概率校准并进行归一化处理,得到所述初始识别图像所包含文字的文字识别结果,从而通过增加文字识别概率的校准误差,实现对OCR文字识别的自适应校准,能够解决识别错误率的校准问题,减少人工干预,提高文字识别中字符预测的准确性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110735014.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拉伸式纸尿裤
- 下一篇:一种文件下载权限的管理方法和装置