[发明专利]基于深度学习的确认OCR识别结果可靠性的方法及介质有效
申请号: | 201910160850.0 | 申请日: | 2019-03-04 |
公开(公告)号: | CN109919076B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 郝占龙;林玉玲;陈文传;杜保发 | 申请(专利权)人: | 厦门商集网络科技有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 何小星 |
地址: | 361101 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于深度学习的确认OCR识别结果可靠性的方法,包括如下步骤:将OCR识别得到的票据影像按设定的字段进行分割,生成多个字段碎片图像和各字段碎片图像在所述票据影像上的坐标信息;对各字段碎片图像进行单字分割,生成单字图像和单字图像在所述票据影像上的坐标信息;对所述单字图像进行特征提取,得到单字的第一特征矩阵;根据所述单字图像的坐标信息从标准库提取OCR识别结果中该坐标位置对应的单字的标准特征矩阵,逐个计算所述单字的第一特征矩阵与对应的标准特征矩阵的相似度,若计算结果在设定的相似度阈值范围内,则认为该单字识别正确。本发明优点:核验OCR识别结果,大幅提高识别结果的精准度,减少人工工作量。 | ||
搜索关键词: | 基于 深度 学习 确认 ocr 识别 结果 可靠性 方法 介质 | ||
【主权项】:
1.一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于:包括如下步骤:将OCR识别得到的票据影像按设定的字段进行分割,生成多个字段碎片图像,同时生成各所述字段碎片图像在所述票据影像上的坐标信息;对各所述字段碎片图像进行单字分割,生成单字图像和单字图像在所述票据影像上的坐标信息;通过深度学习模型对所述单字图像进行特征提取,将单字图像转换为单字的第一特征矩阵;根据所述单字图像的坐标信息从标准库中提取OCR识别结果中该坐标位置对应的单字的标准特征矩阵,逐个计算所述单字的第一特征矩阵与对应的标准特征矩阵的相似度,若计算结果在设定的相似度阈值范围内,则认为该单字识别正确,否则认为该单字识别错误。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910160850.0/,转载请声明来源钻瓜专利网。