[发明专利]一种跨域网络训练及图像识别方法在审
申请号: | 201811500433.8 | 申请日: | 2018-12-07 |
公开(公告)号: | CN111291780A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 刘若鹏;栾琳;赵盟盟 | 申请(专利权)人: | 深圳光启空间技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市龙岗区坂田街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 训练 图像 识别 方法 | ||
本发明涉及一种跨域网络训练及图像识别方法,该跨域网络训练包括:S1,向深度神经网络输入第一域和第二域的样本数据,对所述第一域和第二域的样本数据进行训练,使得在所述深度神经网络在第一域与第二域上各自具有分类能力;S2:消除域间统计分布差异,使得第一域和第二域具有相近的统计分布特性;S3:对第一域和第二域进行加强内聚集的训练;S4:对符合预设条件的训练结果进行保存。实施本发明,即使在数据具有不同统计分布特性的情况下,也能够正确的识别出来。
技术领域
本发明涉及人工智能领域,具体的,涉及一种跨域网络训练及图像识别方法。
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
现有人脸识别算法大多可以解决单域人脸识别(即待识别图像和训练样本图像具有相同的统计分布特性)问题,例如,使用视频作为训练样本,然后对训练好的网络识别其他视频中的人脸。Florian Schroff等人提出的Facenet算法是目前效果较好的单域人脸识别算法,同时作者也给出了相应的单域数据训练方法。
但在实际应用场最下,监控摄像头拍摄视频中提取出的人脸照片具有十分复杂的光照、角度、分辨率和表情等变化因素,这使得待识别图像与训练样本图像具有差异巨大的统计分布特性,即跨域识别问题。目前的人工智能网络很难对跨域的图像实现准确的识别。
发明内容
本发明的目的在于,针对现有的图像识别方法无法对跨域的场景实现准确的识别的缺陷,提供一种新的跨域图像识别方法,以克服目前的图像识别技术在跨域识别的场最中准确性差的问题。
本发明的一个方面提供一种跨域网络训练方法,包括以下步骤:
S1:向深度神经网络输入第一域和第二域的样本数据,对第一域和第二域的样本数据进行训练,使得在深度神经网络在第一域与第二域上各自具有分类能力;
S2:消除域间统计分布差异,使得第一域和第二域具有相近的统计分布特性;
S3:对第一域和第二域进行加强内聚集的训练;
S4:对符合预设条件的训练结果进行保存。
较佳的,步骤S1中对第一域和第二域的样本数据进行训练包括:对第一域和第二域的样本数据进行损失函数Triplet-Loss的训练。
较佳的,步骤S2包括:当损失函数Triplet-Loss稳定且满足收敛时,用第一域和第二域的最高维度特征计算最大均值差异损失MMD-Loss,并将结果加入合成损失函数,共同进行反向传播和梯度求导。
较佳的,步骤S3包括:将合成损失函数中的MMD-Loss去除,并加入第一域和第二域的混合Triplet-Loss,进行加强内聚集的训练。
较佳的,,步骤S4包括:当加强内聚集的训练的合成损失函数收敛且小于设定值时,对训练结果进行保存。
较佳的,步骤S1中,进行损失函数Triplet-Loss的训练还包括:设置第一学习率,第一学习率初始值为0.001至0.01,每10轮进行损失函数Triplet-Loss的训练,将第一学习率设置为0.7至0.9倍。
较佳的,步骤S2中,设置第二学习率,第二学习率的初始值小于第一学习率的初始值,每10轮进行加强内聚集的训练,将第二学习率设置为0.7至0.9倍。
较佳的,第二学习率初始值为0.0001至0.001。
较佳的,步骤S3中,设置第三学习率,第三学习率的初始值小于第一学习率的初始值,每5轮进行加强内聚集的训练,将第三学习率设置为0.7至0.9倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳光启空间技术有限公司,未经深圳光启空间技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811500433.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序