[发明专利]一种模型训练、字符识别方法、装置、设备及存储介质有效
申请号: | 202111248583.6 | 申请日: | 2021-10-26 |
公开(公告)号: | CN113971806B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 徐杨柳;谢群义;陈毅;钦夏孟;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/194 | 分类号: | G06V30/194;G06V30/24;G06N3/0464;G06N3/044;G06N3/09;G06N3/084 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;马敬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 字符 识别 方法 装置 设备 存储 介质 | ||
本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景下。具体实现方案为:获得场景图像、所述场景图像中的第二实际字符和第二构建图像;采用所述待训练模型对所述场景图像进行字符识别,得到字符识别过程中提取的字符的第一特征和第一识别字符;采用所述辅助训练模型对所述第二构建图像进行字符识别,得到字符识别过程中提取的字符的第二特征;基于所述第一识别字符、第二实际字符、第一特征和第二特征,对所述待训练模型的模型参数进行调整,得到字符识别模型。应用本公开实施例提供的方案能够训练得到用于进行字符识别的模型。
技术领域
本公开涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景下。
背景技术
近年来OCR(Optical Character Recognition,光学字符识别)技术在金融、交通、教育等各行各业得到了广泛关注和应用。电子设备基于OCR技术能够将图像中的字符翻译成计算机可识别的字符,实现字符识别。
另外,当前人工智能技术也得到了快速发展,人工智能技术逐渐被引入字符识别场景,越来越多的人意识到使用神经网络模型实现字符识别,能够显著提高字符识别的效率和准确度。因此,如何训练神经网络模型,得到用于进行字符识别的模型成为一个亟需待解决的问题。
发明内容
本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种模型训练方法,包括:
采用第一构建图像和所述第一构建图像中的第一实际字符对初始神经网络模型进行训练得到待训练模型和辅助训练模型;
获得场景图像、所述场景图像中的第二实际字符和第二构建图像,其中,所述第二构建图像中的字符与所述第二实际字符相同;
采用所述待训练模型对所述场景图像进行字符识别,得到字符识别过程中提取的字符的第一特征和第一识别字符;
采用所述辅助训练模型对所述第二构建图像进行字符识别,得到字符识别过程中提取的字符的第二特征;
基于所述第一识别字符、第二实际字符、第一特征和第二特征,对所述待训练模型的模型参数进行调整,得到字符识别模型。
根据本公开的另一方面,提供了一种字符识别方法,包括:
获得待识别图像;
将所述待识别图像输入字符识别模型,得到所述字符识别模型输出的识别字符,其中,所述字符识别模型为按照上述模型训练方法进行训练得到的模型。
根据本公开的另一方面,提供了一种模型训练装置,包括:
模型获得模块,用于采用第一构建图像和所述第一构建图像中的第一实际字符对初始神经网络模型进行训练得到待训练模型和辅助训练模型;
第一图像获得模块,用于获得场景图像、所述场景图像中的第二实际字符和第二构建图像,其中,所述第二构建图像中的字符与所述第二实际字符相同;
字符确定模块,用于采用所述待训练模型对所述场景图像进行字符识别,得到字符识别过程中提取的字符的第一特征和第一识别字符;
特征确定模块,用于采用所述辅助训练模型对所述第二构建图像进行字符识别,得到字符识别过程中提取的字符的第二特征;
第一模型训练模块,用于基于所述第一识别字符、第二实际字符、第一特征和第二特征,对所述待训练模型的模型参数进行调整,得到字符识别模型。
根据本公开的另一方面,提供了一种字符识别装置,包括:
第二图像获得模块,用于获得待识别图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111248583.6/2.html,转载请声明来源钻瓜专利网。