[发明专利]文本识别方法、装置、计算机设备和存储介质在审

申请号：	202011390409.0	申请日：	2020-12-02
公开（公告）号：	CN112560599A	公开（公告）日：	2021-03-26
发明（设计）人：	陈光	申请（专利权）人：	上海眼控科技股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	姜晓云
地址：	200030 上海市徐汇***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种文本识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别文本图像；将待识别文本图像输入至预先训练的机器学习模型中，以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容，机器学习模型是根据多个训练文本图像训练得到，每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。采用本方法能够提高文本内容的识别效率。

技术领域

本申请涉及人工智能技术领域，特别是涉及一种文本识别方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展，计算机的硬件性能越来越高，这使得近年来深度学习计算机视觉领域在硬件设备的支持下飞速发展。其中，深度学习技术在文本识别领域有着极大的技术突破和丰富的应用场景。

当前主要的文本识别已经从传统的分割字符、特征提取、字符分类流程替代为深度学习的方法，研究人员通过CNN网络和RNN网络能够有效的进行文本识别。

但目前的文本识别网络不能很好的判断出检测到文本的排列方向，使得文本内容信息的识别效率低下。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高图像文本内容识别效率的文本识别方法、装置、计算机设备和存储介质。

一种文本识别方法，方法包括：

获取待识别文本图像；

将待识别文本图像输入至预先训练的机器学习模型中，以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容，机器学习模型是根据多个训练文本图像训练得到，每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。

在一个实施例中，根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容，包括：

根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本排列方向识别结果，以及多个文本内容识别结果；

从多个文本内容识别结果中提取与文本排列方向识别结果对应的文本内容识别结果，并将提取到的文本内容识别结果作为待识别文本图像的文本识别内容。

在一个实施例中，机器学习模型包括文本排列方向识别模型以及文本内容识别模型；文本排列方向识别模型以及文本内同识别模型的训练方式，包括：

获取多个训练文本图像；

将训练文本图像分别输入至初始文本排列方向识别模型中，以根据初始文本排列方向识别模型中的初始排列方向识别参数对训练文本图像中的文本内容的文本排列方向进行识别，得到文本排列方向初始识别结果；

根据文本排列方向初始识别结果确定与训练文本图像对应的初始文本内容识别模型，并利用确定的初始文本内容识别模型对应的初始内容识别参数对训练文本图像的文本内容进行识别得到文本内容初始识别结果；

根据文本排列方向初始识别结果、文本内容初始识别结果以及真实标签确定目标损失函数；

根据目标损失函数对初始排列方向识别参数以及初始内容识别参数进行调整，直至满足训练结束条件时，获取当前排列方向识别参数以及当前内容识别参数，并根据当前排列方向识别参数得到文本排列方向识别模型以及根据当前内容识别参数得到文本内容识别模型。

在一个实施例中，将训练文本图像分别输入至初始文本排列方向识别模型中，包括：

提取训练文本图像的图像特征，得到训练文本图像特征；

将训练文本图像特征分别输入至初始文本排列方向识别模型中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司，未经上海眼控科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011390409.0/2.html，转载请声明来源钻瓜专利网。

上一篇：激光管连接器
下一篇：一种舱内装载冷藏箱的集装箱船及其横舱壁水平桁布置结构

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本识别方法、装置、计算机设备和存储介质在审

专利文献下载