[发明专利]一种基于建模的OCR识别结果判决方法和设备有效
申请号: | 201910323742.0 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110059705B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 郝占龙;庄国金;陈文传;杜保发;林玉玲;吴建杭;方恒凯 | 申请(专利权)人: | 厦门商集网络科技有限责任公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/34 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 何小星 |
地址: | 361101 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 建模 ocr 识别 结果 判决 方法 设备 | ||
1.一种基于建模的OCR识别结果判决方法,其特征在于,包括如下步骤:
建立字符图像的特征提取模型;所述特征提取模型为Lenet、AlexNet、VggNet、ResNet、GoogLeNet其中一种卷积神经网络;使用单字符样本训练所述特征提取模型;
将标准的各字符图像输入所述特征提取模型,得到各个字符对应的标准特征矩阵,建立包含所述标准特征矩阵的标准字符特征库;
通过OCR识别引擎识别文本,得到OCR识别图像;
通过所述特征提取模型获得OCR识别图像中各字符的单字符特征矩阵;
逐一将字符的单字符特征矩阵与该字符对应的标准字符特矩阵进行比较,判断二者之间的相似度,从而判定OCR识别结果的正确性;
特征提取模型获得所述单字符特征矩阵的步骤为:将OCR识别图像进行单字符切割,生成单字符图像,将各单字符图像逐个输入所述特征提取模型得到单字符特征矩阵;
所述单字符特征矩阵与该单字符对应的标准字符特矩阵进行比较是采用软阈值模型进行判决,所述软阈值模型为:,其中,y为判决结果,函数为非线性函数或线性函数,S表示标准特征矩阵,P表示单字符特征矩阵;
所述软阈值模型,通过样本训练软阈值模型得到,具体地:创建样本集合,所述样本集合中包含多组样本,每组样本包含两个字符的特征向量,当该组样本中的两个字符相同时,设置y=1,当样本组中的两个字符不相同时,设置y=0,求得函数;
软阈值模型在函数的作用下,一次性得到所有字符的阈值;
所述样本训练过程通过softmax损失函数完成软阈值模型收敛。
2.根据权利要求1所述的一种基于建模的OCR识别结果判决方法,其特征在于:所述OCR识别图像进行单字符切割,生成单字符图像的同时,还生成单字符图像在OCR识别图像中的坐标信息;判定字符识别错误时,根据该单字符图像的坐标信息在OCR识别图像中定位出错位置并提示用户。
3.根据权利要求1所述的一种基于建模的OCR识别结果判决方法,其特征在于:所述特征提取模型采用softmax损失函数,使用单字符样本训练所述特征提取模型,所述softmax损失函数的值不再减少,完成模型收敛。
4.一种基于建模的OCR识别结果判决设备,其特征在于:包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行如权利要求1至3任意项所述的基于建模的OCR识别结果判决方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910323742.0/1.html,转载请声明来源钻瓜专利网。