[发明专利]一种OCR识别方法和设备在审

申请号：	202210950890.7	申请日：	2022-08-09
公开（公告）号：	CN115311663A	公开（公告）日：	2022-11-08
发明（设计）人：	马嘉林;孙瑛;孙钦平;崔方剑;张春雨	申请（专利权）人：	青岛海信信息科技股份有限公司
主分类号：	G06V30/19	分类号：	G06V30/19;G06V30/14;G06V30/148
代理公司：	北京睿博行远知识产权代理有限公司 11297	代理人：	计小玲
地址：	266000 山东省***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种 ocr 识别方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种OCR识别方法，其特征在于，所述方法包括：

获取待检测图像；

通过文本检测模型对所述待检测图像进行文本检测；

基于通用图像识别模型匹配所述待检测图像对应的模板，基于所述模板对所述待检测图像进行文本识别，并输出识别结果。

2.如权利要求1所述的方法，其特征在于，通过文本检测模型对所述待检测图像进行文本检测，具体为：

获取所述待检测图像的位置特征信息，并基于所述位置特征信息确定所述待检测图像的类型；

调用待检测图像的类型对应的文本检测模型识别所述待检测图像的文本信息的位置，截取所述文本信息的对应位置，并在截取后发送到所述通用图像识别模型进行图像识别。

3.如权利要求2所述的方法，其特征在于，所述通用图像识别模型还包括表格识别模型，基于通用图像识别模型匹配所述待检测图像对应的模板，基于所述模板对所述待检测图像进行文本识别，并输出识别结果，具体为：

通过所述通用图像识别模型匹配与所述待检测图像对应的模板；

基于所述模板识别所述待检测图像的文本信息；

基于所述表格识别模型确定所述待检测图像的结构化信息；

基于所述文本信息及所述结构化信息输出识别结果。

4.如权利要求1所述的方法，其特征在于，所述文本检测模型的建立过程具体为：

获取多种类型的样本图像；

提取各样本图像的关键文字的位置特征信息，根据所述位置特征信息构建所述文本检测模型。

5.如权利要求1所述的方法，其特征在于，所述通用图像识别模型的建立过程具体为：

获取多个类型的样本图像，提取所述样本中训练图像所记载文本信息的文字特征信息；

获取文字特征信息对应的训练文本信息，分析文字特征信息与训练文本信息之间的对应关系，得到映射信息；

根据所述映射信息构建通用识别模型。

6.如权利要求3所述的方法，其特征在于，通过所述通用图像识别模型匹配与所述待检测图像对应的模板，具体为：

根据模板中的参考字段与所述待检测图像中的字段进行匹配，以获取所述待检测图像对应的模板；

基于所述参考字段与所述待检测图像的字段的框坐标调节待检测图像的大小，以使待检测图像与所述模板大小一致；

基于所述框坐标调节参考字段与所述待检测图像的字段之间的坐标偏差。

7.如权利要求1所述的方法，其特征在于，通过文本检测模型对所述待检测图像进行文本检测之前，还包括：

对所述待检测图像进行预处理，所述预处理包括进行灰度化、二值化、平滑处理。

8.如权利要求1所述的方法，其特征在于，所述方法还包括：

在对所述待检测图像进行识别过程中，对所述待检测图像进行图像模糊增强、倾斜校正处理。

9.如权利要求1所述的方法，其特征在于，所述方法还包括：

获取通过OCR识别后的文字信息，将所述识别后的文字信息与原始文本中的正确文字信息进行逐行匹配，并确定每行匹配失败的文字数量；

根据正确文字信息的每行文字总数量与匹配失败的文字数量计算OCR识别结果中的文字信息中每行文字的OCR识别准确率；

根据每行文字的OCR识别准确率计算所有行文字的OCR识别准确率。

10.一种OCR识别设备，其特征在于，所述设备包括：

获取模块，用于获取待检测图像；

文本检测模块，通过文本检测模型对所述待检测图像进行文本检测；

图像识别模块，用于基于通用图像识别模型匹配所述待检测图像对应的模板，基于所述模板对所述待检测图像进行文本识别，并输出识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于青岛海信信息科技股份有限公司，未经青岛海信信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210950890.7/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载