[发明专利]图像相似度确定及模型训练方法、装置、设备和介质有效
申请号: | 202110252999.9 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112633420B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 张蓓蓓;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/08 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 阮改燕 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 相似 确定 模型 训练 方法 装置 设备 介质 | ||
1.一种图像相似度确定模型训练方法,其特征在于,包括:
收集多个手写字符图像,并基于各所述手写字符图像和预设数据增广模型进行数据增广操作,生成训练样本集;其中,所述手写字符图像包含易辨识手写字符图像和难辨识手写字符图像,所述预设数据增广模型基于书写运动学而构建;
基于所述训练样本集,对预设神经网络模型进行训练,生成图像相似度确定模型;
所述基于所述训练样本集,对预设神经网络模型进行训练,生成图像相似度确定模型包括:
基于所述训练样本集和正负样本比例,构建包含各正样本的正样本集和包含各负样本的负样本集;其中,所述正样本包含任一个所述易辨识手写字符图像和第三预设数量的所述难辨识手写字符图像,且相应难辨识手写字符图像中的字符和相应易辨识手写字符图像中的字符相同;所述负样本包含任一个所述易辨识手写字符图像和所述第三预设数量的其他手写字符图像,所述其他手写字符图像包含所述易辨识手写字符图像和/或所述难辨识手写字符图像,且所述其他手写字符图像中的字符和相应易辨识手写字符图像中的字符不同;
基于各所述正样本和各所述负样本,对所述预设神经网络模型进行训练,生成所述图像相似度确定模型;
所述预设神经网络模型包含特征提取子网络和相似度估计子网络;其中,所述特征提取子网络为包含第四预设数量个分支的卷积神经网络,每个所述分支包含5个卷积层和3个池化层,所述第四预设数量个分支之间共享权重;所述第四预设数量为所述第三预设数量加1;所述相似度估计子网络包含3个全连接层和损失函数,且最后一个所述全连接层的节点数为所述第三预设数量;
所述基于各所述正样本和各所述负样本,对所述预设神经网络模型进行训练,生成所述图像相似度确定模型包括:
将所述训练样本集中的任一样本中的所述易辨识手写字符图像输入所述预设神经网络模型的第一分支,将所述样本中的剩余手写字符图像分别输入所述预设神经网络模型的各剩余分支,并运行所述预设神经网络模型,输出模型训练结果;其中,所述样本为所述正样本或所述负样本,所述模型训练结果为所述第三预设数量的图像相似度值;
基于所述模型训练结果、所述样本的样本类型和所述样本类型的训练参照值,利用所述损失函数,确定损失值;其中,所述样本类型为正样本类型或负样本类型;
若所述损失值或训练次数未满足模型收敛条件,则基于所述损失值,调整所述预设神经网络模型的模型参数,并继续模型训练过程,直至所述损失值或所述训练次数满足所述模型收敛条件,生成所述图像相似度确定模型。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述手写字符图像和预设数据增广模型进行数据增广操作,生成训练样本集包括:
将每个所述手写字符图像和各字符形变调整参数的设定参数值输入所述预设数据增广模型,生成相应手写字符图像的增广字符图像;其中,所述预设数据增广模型由第一预设数量的对数高斯函数响应信号构成,且每个所述对数高斯函数响应信号由第二预设数量的所述字符形变调整参数控制形变程度;
由各所述手写字符图像和各所述增广字符图像构建所述训练样本集。
3.根据权利要求1所述的方法,其特征在于,所述基于所述模型训练结果、所述样本的样本类型和所述样本类型的训练参照值,利用所述损失函数,确定损失值包括:
若所述样本的样本类型为所述正样本类型,则基于所述模型训练结果中的最小图像相似度值和所述正样本类型的训练参照值,利用所述损失函数,确定所述损失值;
若所述样本的样本类型为所述负样本类型,则基于所述模型训练结果中的最大图像相似度值和所述负样本类型的训练参照值,利用所述损失函数,确定所述损失值。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述手写字符图像为手写数字图像,所述第三预设数量为9。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110252999.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序