[发明专利]一种基于跨域快速迁移的视觉拣选方法及装置有效
申请号: | 202110514446.6 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113221916B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 张正;赵书光;卢光明 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/74;G06V10/774;G06V10/80 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 覃迎峰 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 迁移 视觉 拣选 方法 装置 | ||
本发明公开了一种基于跨域快速迁移的视觉拣选方法及装置,从缩小跨域特征之间的差异度出发,考虑单一相似性度量的局限性,提出了基于特征相似性度量加权融合的算法,使用多种相似性度量加权融合,对跨域特征进行全面分析、约束,以减小特征差异,提高拣选模型在真实域工作的准确率和工作效率;提出基于注意力机制的对抗学习算法,在考虑全局特征的基础上,针对零件所在的局部区域特征,使用注意力机制着重减小该区域的差异性,以学习跨域不变的特征,实现跨越仿真域与真实域之间的鸿沟,保证跨域后模型性能的鲁棒性。
技术领域
本发明属于机器学习技术领域,具体涉及一种视觉拣选方法及装置。
背景技术
目标拣选模型是智能制造与柔性制造发展的核心技术,实现工业加工、检测和装配的无人化生产,在机械加工、汽车制造、仓储物流和3C等领域有广阔的应用前景。
目前主流技术是使用仿真技术生成大量的仿真标注数据用于视觉拣选模型训练,提高视觉拣选模型的鲁棒性、自适应能力,解决缺少标注数据和性能难以满足真实拣选场景等问题。考虑到仿真数据和真实数据之间存在差异,即使视觉拣选模型在仿真环境中能够有效预测,但将其直接用于真实环境时依然难以保证模型的性能。
发明内容
本发明为了解决现有技术中的问题,提出了一种基于跨域快速迁移的视觉拣选方法及装置,采用域随机化技术增加训练数据的多样性,从数据层面提高拣选模型在真实拣选环境的泛化能力,另一方面,研究基于特征分布的跨域快速迁移技术,从特征层面提高拣选模型的性能,实现视觉拣选模型在真实拣选场景的高效、鲁棒运行。
为了达到上述目的,本发明的实施例提供了一种基于跨域快速迁移的视觉拣选方法,包括:
基于学习的域随机化,采集仿真域的参数数据;
获取仿真域数据特征和真实域数据特征;
针对不同的仿真域数据设计其学习模型的适应层;
在所述适应层使用基于相似性度量加权融合算法和基于注意力机制的对抗学习算法对特征加以约束;
其中,基于相似性度量加权融合算法计算适应层的跨域特征之间的多种相似性度量作为损失,所述损失作用于所述适应层,以及,
基于注意力机制的对抗学习算法使用对抗网络模块区分特征所属领域,并计算对抗损失,该损失使跨域特征无法区分,即学习跨域不变特征;
根据不同的任务将特征映射到相应的任务结果空间,并最终输出任务相关结果。
进一步地,基于学习的域随机化,采集仿真域的参数数据,具体包括:结合真实域的引导信息,对于仿真域的参数z,以先验分布p(z)为初始条件,基于强化学习技术求解分布pφ(z),其中,φ表示该分布可学习的参数;
进一步地,所述域随机化从两方面对仿真域的参数进行随机化采样:视觉参数,主要包括场景中物体数量,目标纹理,背景颜色,光照,随机化噪声;动力学参数:主要包含物体质量、摩擦系数、高度。
进一步地,基于强化学习技术求解分布pφ(z)所求解的问题表示如下:
其中第一项LDR()表示设计价值函数,保证分布pφ(z)最终能得到多样化的样本,第二项D()基于分布距离度量,保证预测的分布与参考分布之间的相似性,减少结果的不稳定性,α为……。
进一步地,所述基于相似性度量加权融合算法的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110514446.6/2.html,转载请声明来源钻瓜专利网。