[发明专利]一种基于跨域快速迁移的视觉拣选方法及装置有效
申请号: | 202110514446.6 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113221916B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 张正;赵书光;卢光明 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/74;G06V10/774;G06V10/80 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 覃迎峰 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 迁移 视觉 拣选 方法 装置 | ||
1.一种基于跨域快速迁移的视觉拣选方法,其特征在于,所述方法包括:
基于学习的域随机化,采集仿真域的参数数据,具体包括:结合真实域的引导信息,对于仿真域的参数z,以先验分布p(z)为初始条件,基于强化学习技术求解分布pφ(z),其中,φ表示该分布可学习的参数;所述域随机化从两方面对仿真域的参数进行随机化采样:视觉参数,主要包括场景中物体数量,目标纹理,背景颜色,光照,随机化噪声;动力学参数:主要包含物体质量、摩擦系数、高度;
获取仿真域数据特征和真实域数据特征;
针对不同的仿真域数据设计其学习模型的适应层;
在所述适应层使用基于相似性度量加权融合算法和基于注意力机制的对抗学习算法对特征加以约束;
其中,基于相似性度量加权融合算法计算适应层的跨域特征之间的多种相似性度量作为损失,所述损失作用于所述适应层,以及,
基于注意力机制的对抗学习算法使用对抗网络模块区分特征所属领域,并计算对抗损失,该损失使跨域特征无法区分,即学习跨域不变特征;
根据不同的任务将特征映射到相应的任务结果空间,并最终输出任务相关结果;
其中,所述基于相似性度量加权融合算法的损失函数为:
其中,Ltask(fs,fa,fc,xs,xt,d)在源域上的任务损失函数,xs,ys分别为仿真域的数据及其标签,xt为真实域的数据,模型的编码器、适应层和解码器分别记为fs,fa,fc,为针对k种不同相似度的域适应定义相应的损失函数,λi为不同相似度度量对应的权重,di是第i种相似性度量,d={d1,d2,...,dk}是所有相似性度量量的集合。
2.根据权利要求1所述的方法,其特征在于:基于强化学习技术求解分布pφ(z)所求解的问题表示如下:
其中p(z)为先验分布,pφ(z)为基于强化学习技术求解的分布,φ表示该分布可学习的参数,第一项LDR()表示设计价值函数,保证分布pφ(z)最终能得到多样化的样本,第二项D()基于分布距离度量,保证预测的分布与参考分布之间的相似性,减少结果的不稳定性,α是一个平衡超参数,用来平衡两个度量之间的重要程度。
3.根据权利要求1所述的方法,其特征在于:所述对抗网络模块fd,用于辨别数据来自仿真域或真实域,令yd为域标签,代表数据所属领域,令辨别器fd的损失函数为Ld(fs,fa,fd,xs,xt,yd),则该模型的整体损失函数如下:
L'all(fs,fa,fc,fd,xs,xt,ys,yd)=Ltask(fs,fa,fc,xs,ys)+λLd(fs,fa,fd,xs,xt,yd)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110514446.6/1.html,转载请声明来源钻瓜专利网。