[发明专利]OCR系统的评估方法、装置、设备及可读存储介质有效
申请号: | 202011275415.1 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112100431B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 高超;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/55;G06T11/60;G06N3/04;G06N3/08 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 魏润洁 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ocr 系统 评估 方法 装置 设备 可读 存储 介质 | ||
1.一种OCR系统的评估方法,其特征在于,所述OCR系统的评估方法包括以下步骤:
获取训练图像,并将所述训练图像输入至初始OCR系统中,以对所述初始OCR系统进行训练,得到训练完成所述初始OCR系统后对应的OCR系统,其中,所述OCR系统包括文字检测模型和文字识别模型;
将待识别图像输入至所述OCR系统中,以基于所述OCR系统确定所述待识别图像对应的文字识别结果;
基于所述文字识别结果以及所述待识别图像对应的实际标注数据,确定所述OCR系统对应的文字召回率以及所述OCR系统对应的文字识别精确率,并基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标,以基于所述评估指标评估所述OCR系统的性能;
其中,所述将待识别图像输入至所述OCR系统中,以基于所述OCR系统确定所述待识别图像对应的文字识别结果的步骤包括:
将待识别图像输入至所述文字检测模型中,以基于所述文字检测模型,确定待识别图像对应的中间识别结果,其中,所述中间识别结果为所述文字检测模型识别所述待识别图像得到的文本框;得到所述中间识别结果之后,将包含所述中间识别结果的待识别图像输入至所述文字识别模型中,得到所述待识别图像对应的文字识别结果;
其中,所述基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标的计算公式为:
其中,f1表示所述评估指标,recall表示所述文字召回率,precision表示所述文字识别精确率。
2.如权利要求1所述的OCR系统的评估方法,其特征在于,所述OCR系统包括文字检测模型和文字识别模型,所述将所述训练图像输入至初始OCR系统中,以对所述初始OCR系统进行训练,得到训练完成所述初始OCR系统后对应的OCR系统的步骤包括:
将所述训练图像输入至第一深度学习模型,得到训练完成所述第一深度学习模型后对应的文字检测模型;
基于所述文字检测模型进行训练第二深度学习模型,得到训练完成所述第二深度学习模型后对应的所述文字识别模型。
3.如权利要求2所述的OCR系统的评估方法,其特征在于,所述将所述训练图像输入至第一深度学习模型,得到训练完成所述第一深度学习模型后对应的文字检测模型的步骤包括:
标注所述训练图像,以确定所述训练图像中文本框的预设标注位置,并将包含所述预设标注位置的所述训练图像输入至第一深度学习模型,确定所述训练图像对应的学习标注位置;
基于所述预设标注位置和所述学习标注位置,确定所述第一深度学习模型对应的第一梯度信息;
基于所述第一梯度信息优化所述第一深度学习模型,以确定所述文字检测模型,其中,所述文字检测模型为优化完成的所述第一深度学习模型。
4.如权利要求2所述的OCR系统的评估方法,其特征在于,所述基于所述文字检测模型进行训练第二深度学习模型,得到训练完成所述第二深度学习模型后对应的所述文字识别模型的步骤包括:
获取文本条图像,并将所述文本条图像输入至所述文字检测模型,得到标注文字位置的所述文本条图像;
将标注文字位置的所述文本条图像输入至第二深度学习模型,得到所述文本条图像对应的学习文字内容;
基于所述学习文字内容,确定所述第二深度学习模型对应的第二梯度信息,并基于所述第二梯度信息优化所述第二深度学习模型,以确定所述文字识别模型,其中,所述文字识别检测模型为优化完成的所述第二深度学习模型。
5.如权利要求1所述的OCR系统的评估方法,其特征在于,所述基于所述文字召回率和所述文字识别精确率计算所述OCR系统的评估指标,以基于所述评估指标评估所述OCR系统的性能的步骤之后,还包括:
当接收到图像存储请求时,获取所述图像存储请求对应的待存储图像;
在所述OCR系统的性能达标时,将所述待存储图像输入至所述OCR系统,基于所述OCR系统确定所述待存储图像中是否存在身份证信息;
若所述待存储图像中不存在身份证信息,则执行所述图像存储请求对应的图像存储操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011275415.1/1.html,转载请声明来源钻瓜专利网。