[发明专利]图像相似度确定及模型训练方法、装置、设备和介质有效
申请号: | 202110252999.9 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112633420B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 张蓓蓓;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/08 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 阮改燕 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 相似 确定 模型 训练 方法 装置 设备 介质 | ||
本公开涉及图像处理技术领域,公开了一种图像相似度确定及模型训练方法、装置、设备和介质。该方法包括:收集多个手写字符图像,并基于各所述手写字符图像和预设数据增广模型进行数据增广操作,生成训练样本集;其中,所述手写字符图像包含易辨识手写字符图像和难辨识手写字符图像,所述预设数据增广模型基于书写运动学而构建;基于所述训练样本集,对预设神经网络模型进行训练,生成图像相似度确定模型。通过上述技术方案,实现了基于书写运动学原理对收集的少量手写字符图像进行数据增广,以获取大量训练样本,提高了模型训练效率以及模型对手写字符图像的识别准确率。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像相似度确定及模型训练方法、装置、设备和介质。
背景技术
字符图像相似度评估是图像相似度评估的特定问题,所谓字符图像就是指图像的内容是字符、字母或者数字。字符图像相似度评估在很多问题中都有非常重要的价值,如笔迹对比、拍照搜题、电子化批改作业等。通过字符图像相似度评估可以识别图像中的手写字符,然后将识别的手写字符与其可能的标准字符图像进行比较,得到两者之间的相似度,为后续的字迹对比、判题和搜索等操作提供有力的先验知识。
目前的图像相似度评估多是利用深度学习方法,其利用神经网络模型对图像进行特征提取,能够将图像的数值信息和语义信息全部利用起来,并通过反向传播算法来优化损失函数,当损失函数的值被优化达到一个比较好的结果时,网络对图像进行相似度评估能够取得非常好的结果。
但是,考虑到书写者的笔迹与标准体之间的差距,以及书写者涂改、勾画、涂抹等随意操作导致的手写字符极难辨认或无法辨识等情况,使得基于深度学习的神经网络模型的字符识别的置信度很低。为了提高难辨识手写字符的模型识别准确率,需要利用大量的训练样本进行模型训练,但是,难辨识手写字符的训练样本的收集难度大,人力耗费大,使得模型训练效率低。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种图像相似度确定及模型训练方法、装置、设备和介质。
第一方面,本公开提供了一种图像相似度确定模型训练方法,该方法包括:
收集多个手写字符图像,并基于各所述手写字符图像和预设数据增广模型进行数据增广操作,生成训练样本集;其中,所述手写字符图像包含易辨识手写字符图像和难辨识手写字符图像,所述预设数据增广模型基于书写运动学而构建;
基于所述训练样本集,对预设神经网络模型进行训练,生成图像相似度确定模型。
在一些实施例中,所述基于各所述手写字符图像和预设数据增广模型进行数据增广操作,生成训练样本集包括:
将每个所述手写字符图像和各字符形变调整参数的设定参数值输入所述预设数据增广模型,生成相应手写字符图像的增广字符图像;其中,所述预设数据增广模型由第一预设数量的对数高斯函数响应信号构成,且每个所述对数高斯函数响应信号由第二预设数量的所述字符形变调整参数控制形变程度;
由各所述手写字符图像和各所述增广字符图像构建所述训练样本集。
在一些实施例中,所述基于所述训练样本集,对预设神经网络模型进行训练,生成图像相似度确定模型包括:
基于所述训练样本集和正负样本比例,构建包含各正样本的正样本集和包含各负样本的负样本集;其中,所述正样本包含任一个所述易辨识手写字符图像和第三预设数量的所述难辨识手写字符图像,且相应难辨识手写字符图像中的字符和相应易辨识手写字符图像中的字符相同;所述负样本包含任一个所述易辨识手写字符图像和所述第三预设数量的其他手写字符图像,所述其他手写字符图像包含所述易辨识手写字符图像和/或所述难辨识手写字符图像,且所述其他手写字符图像中的字符和相应易辨识手写字符图像中的字符不同;
基于各所述正样本和各所述负样本,对所述预设神经网络模型进行训练,生成所述图像相似度确定模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110252999.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序