[发明专利]文本字符的识别方法、装置和服务器在审

申请号：	202110300713.X	申请日：	2021-03-22
公开（公告）号：	CN112883956A	公开（公告）日：	2021-06-01
发明（设计）人：	陈思念;杨兴业;石雪;张宇鸿	申请（专利权）人：	中国工商银行股份有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/62;G06N3/08
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	任默闻;王涛
地址：	100140 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本字符识别方法装置服务器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书提供了文本字符的识别方法、装置和服务器。基于该方法，具体实施前，可以预先训练建立至少包含有低层卷积网络层、高层卷积网络层，以及fire模块，且在低层卷积网络层与高层卷积网络层之间还设置有跨层连接的预设的字符识别模型；具体实施时，在获取待处理的目标图像后，可以调用上述预设的字符识别模型处理目标图像，得到对应的处理结果；再根据处理结果，识别确定出目标图像所包含的目标文本字符。从而可以通过调用上述支持多尺度特征提取、效果较好的预设的字符识别模型，有效地适用诸如存在重叠的文本字符等复杂的识别场景，精准、高效地识别确定出图像中的文本字符，减少识别误差，提高字符识别的准确度。

技术领域

本说明书属于人工智能技术领域，尤其涉及文本字符的识别方法、装置和服务器。

背景技术

在许多数据处理场景中，系统所直接获得的往往是包含有文本字符的图像数据。这时，系统需要先通过对上述图像数据进行文本字符识别(例如，OCR识别)，以提取出图像数据中所包含的文本字符；再根据所提取出的文本字符进行具体的数据处理。

但是，针对一些比较复杂的识别场景，例如，图像中的文本字符由于某些原因出现了重叠导致字符难以辨识，基于现有方法往往很难准确地识别出图像中的真实的文本字符。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本说明书提供了一种文本字符的识别方法、装置和服务器，能够适用诸如存在重叠的文本字符等复杂的识别场景，精准、高效地识别确定出图像中的文本字符。

本说明书提供了一种文本字符的识别方法，包括：

获取待处理的目标图像；其中，所述目标图像包含有待识别的目标文本字符；

调用预设的字符识别模型处理所述目标图像，得到对应的处理结果；其中，所述预设的字符识别模型至少包括：低层卷积网络层、高层卷积网络层，以及fire模块，且在低层卷积网络层与所述高层卷积网络层之间还设置有跨层连接；

根据所述处理结果，确定出所述目标文本字符。

在一个实施例中，所述低层卷积网络层包括：第一卷积层、第二卷积层和第三卷积层；所述高层卷积网络层包括：第四卷积层和第五卷积层；所述fire模块包括第一fire模块和第二fire模块。

在一个实施例中，所述第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层按序依次串联；且在所述第四卷积层和第五卷积层之间还依次串联有第一fire模块和第二fire模块。

在一个实施例中，在所述第三卷积层与所述第五卷积层之间设置有跨层连接；和/或，在所述第一卷积层与所述第四卷积层之间设置有跨层连接。

在一个实施例中，在获取待处理的目标图像之前，所述方法还包括：

构建初始模型；其中，所述初始模型至少包含有初始的低层卷积网络层、初始的高层卷积网络层，以及初始的fire模块，且在初始的低层卷积网络层与所述初始的高层卷积网络层之间还设置有跨层连接；

获取样本图像；其中，所述样本图像包含有存在重叠的文本字符；

根据所述样本图像，建立训练集和测试集；并对训练集中的样本图像进行标注，得到标注后的训练集；

利用所述标注后的训练集和所述测试集，训练所述初始模型，得到符合要求的预设的字符识别模型。

在一个实施例中，获取样本图像，包括：

采集包含有文本字符的第一图片数据；

对所述第一图片数据进行扩充处理，得到第二图片数据；

根据文本字符，分割所述第二图片数据，得到多个第三图片数据；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司，未经中国工商银行股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110300713.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本字符的识别方法、装置和服务器在审

专利文献下载