[发明专利]文本识别方法、装置、计算机设备和存储介质在审
申请号: | 202011390409.0 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112560599A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 陈光 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种文本识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别文本图像;将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。采用本方法能够提高文本内容的识别效率。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种文本识别方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,计算机的硬件性能越来越高,这使得近年来深度学习计算机视觉领域在硬件设备的支持下飞速发展。其中,深度学习技术在文本识别领域有着极大的技术突破和丰富的应用场景。
当前主要的文本识别已经从传统的分割字符、特征提取、字符分类流程替代为深度学习的方法,研究人员通过CNN网络和RNN网络能够有效的进行文本识别。
但目前的文本识别网络不能很好的判断出检测到文本的排列方向,使得文本内容信息的识别效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高图像文本内容识别效率的文本识别方法、装置、计算机设备和存储介质。
一种文本识别方法,方法包括:
获取待识别文本图像;
将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。
在一个实施例中,根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,包括:
根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本排列方向识别结果,以及多个文本内容识别结果;
从多个文本内容识别结果中提取与文本排列方向识别结果对应的文本内容识别结果,并将提取到的文本内容识别结果作为待识别文本图像的文本识别内容。
在一个实施例中,机器学习模型包括文本排列方向识别模型以及文本内容识别模型;文本排列方向识别模型以及文本内同识别模型的训练方式,包括:
获取多个训练文本图像;
将训练文本图像分别输入至初始文本排列方向识别模型中,以根据初始文本排列方向识别模型中的初始排列方向识别参数对训练文本图像中的文本内容的文本排列方向进行识别,得到文本排列方向初始识别结果;
根据文本排列方向初始识别结果确定与训练文本图像对应的初始文本内容识别模型,并利用确定的初始文本内容识别模型对应的初始内容识别参数对训练文本图像的文本内容进行识别得到文本内容初始识别结果;
根据文本排列方向初始识别结果、文本内容初始识别结果以及真实标签确定目标损失函数;
根据目标损失函数对初始排列方向识别参数以及初始内容识别参数进行调整,直至满足训练结束条件时,获取当前排列方向识别参数以及当前内容识别参数,并根据当前排列方向识别参数得到文本排列方向识别模型以及根据当前内容识别参数得到文本内容识别模型。
在一个实施例中,将训练文本图像分别输入至初始文本排列方向识别模型中,包括:
提取训练文本图像的图像特征,得到训练文本图像特征;
将训练文本图像特征分别输入至初始文本排列方向识别模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011390409.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:激光管连接器
- 下一篇:一种舱内装载冷藏箱的集装箱船及其横舱壁水平桁布置结构