[发明专利]一种文字识别方法、装置、电子设备及存储介质在审

申请号：	202011511494.1	申请日：	2020-12-18
公开（公告）号：	CN112508004A	公开（公告）日：	2021-03-16
发明（设计）人：	谢群义;徐杨柳;钦夏孟;章成全	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	韩海花
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种文字识别方法、装置、电子设备及存储装置，涉及人工智能领域，具体为计算机视觉和深度学习技术。该方案为：获取测试任务对应的测试样本文字图片和对应的测试样本文字；根据所述测试样本文字图片和所述测试样本文字对预先训练好的元学习模型进行微调，得到测试任务模型；获取所述测试任务对应的测试文字图片；将所述测试文字图片输入至所述测试任务模型，生成所述测试文字图片对应的测试文字。本申请基于元学习方法，降低了文字识别过程中涉及到的测试任务模型对训练样本规模的依赖程度，避免了少量训练样本导致的过拟合现象，确保了文字识别结果的准确率，提高了文字识别过程中的可靠性和效率。

技术领域

本申请的实施例总体上涉及图像处理技术领域，并且更具体地涉及人工智能领域，具体为计算机视觉和深度学习技术。

背景技术

近年来，随着OCR(Optical Character Recognition，光学字符识别)领域相关技术的兴起，文字识别也逐渐成为了重要的研究方向之一。其中，文档文字识别最常见的应用场景主要包括：通用纸质文档识别、财务报销类发票识别，以及其他任意常见的OCR场景。在文字识别过程中，通常依赖大量数据作为文字识别的基础。

然而，现有技术中的文字识别方法，由于数据规模极小，势必会因极易产生过拟合(Overfitting)现象导致文字识别结果准确率极低。因此，如何提高文字识别结果的准确率，已成为了重要的研究方向之一。

发明内容

本申请提供了一种文字识别方法、装置、电子设备及存储介质。

根据第一方面，提供了一种文字识别方法，包括：

获取测试任务对应的测试样本文字图片和对应的测试样本文字；

根据所述测试样本文字图片和所述测试样本文字对预先训练好的元学习模型进行微调，得到测试任务模型；

获取所述测试任务对应的测试文字图片；

将所述测试文字图片输入至所述测试任务模型，生成所述测试文字图片对应的测试文字。

根据第二方面，提供了一种文字识别装置，包括：

第一获取模块，用于获取测试任务对应的测试样本文字图片和对应的测试样本文字；

微调模块，用于根据所述测试样本文字图片和所述测试样本文字对预先训练好的元学习模型进行微调，得到测试任务模型；

第二获取模块，用于获取所述测试任务对应的测试文字图片；