[发明专利]用于借助多任务学习确定对象在对象的周围环境中的姿势的方法和控制设备在审
申请号: | 201880085840.9 | 申请日: | 2018-12-18 |
公开(公告)号: | CN111566700A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | M.布伊;S.扎卡罗夫;S.阿尔巴库尼;S.伊利克 | 申请(专利权)人: | 西门子股份公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 刘畅 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 借助 任务 学习 确定 对象 周围环境 中的 姿势 方法 控制 设备 | ||
1.一种用于确定对象在其周围环境中的姿势的方法,其中借助光学采集设备来采集对象以及其周围环境作为当前图像(xi),并且借助光学图像分析来确定对象的姿势,并且其中借助神经网络(1)将对象的姿势确定为所述神经网络(1)的输出,其中借助通过使用姿势回归(Lpose)和描述符学习(Ld)的多任务学习(LMTL)来训练所述神经网络(1),所述描述符学习通过使用三元组损失函数(Ltriplet)和成对损失函数(Lpair)来确定,
其特征在于,
所述姿势回归(Lpose)借助四元数来确定,所述三元组损失函数(Ltriplet)依据动态裕度项(m)来确定并且所述成对损失函数(Lpair)仅作为锚定函数来确定。
2.根据权利要求1所述的方法,其中通过确定对象的姿势来识别对象类型和/或确定对象相对于对象的周围环境的位置。
3.根据上述权利要求中任一项所述的方法,其中在所述姿势回归(Lpose)中将到所述神经网络(1)的输入x映射到较低维度的属性向量f(x)∈Rd。
4.根据上述权利要求中任一项所述的方法,其中为了学习所述三元组损失函数(Ltriplet),确定与当前图像(xi)相对应的锚图像(si)并且选择拉图像(sj),使得对象的当前图像(xi)与对象的具有相似姿势的图像相对应。
5.根据上述权利要求中任一项所述的方法,其中为了学习所述三元组损失函数(Ltriplet),确定与当前图像(xi)相对应的锚图像(si)并且选择推图像(sk),使得对象的当前图像(xi)与具有另外对象的图像相对应或者与对象的具有不同姿势的图像相对应。
6.根据权利要求4所述的方法,其中在当前图像(xi)与对象的具有相似姿势的图像相对应的情况下,通过反余弦函数来确定所述动态裕度项(m)。
7.根据权利要求5所述的方法,其中在当前图像(xi)与具有另外对象的图像相对应或者与对象的具有不同姿势的图像相对应的情况下,将所述动态裕度项(m)确定为线性函数。
8.根据上述权利要求中任一项所述的方法,其中借助所述成对损失函数(Lpair)将描述符(q)推到一起,所述描述符描述了在相同或至少相似的姿势中但是分别具有不同周围环境的相同对象,或者所述描述符源自不同的域。
9.根据上述权利要求中任一项所述的方法,其中附加地或替换地,借助特定的属性向量f(x)借助最近邻居搜索来确定对象相对于对象的周围环境的位置。
10.根据上述权利要求中任一项所述的方法,其中在图像分析中考虑对象的至少一个对称属性,特别地仅分析对称对象的第一部分,所述第一部分至少相对于对称对象的第二部分对称。
11.根据上述权利要求中任一项所述的方法,其中采集当前图像(xi)作为深度图像。
12.一种控制设备,所述控制设备被设计为用于执行根据上述权利要求中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子股份公司,未经西门子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880085840.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:体组成计以及体组成测定程序
- 下一篇:电子显微镜