[发明专利]用于生成生物体姿态关键点信息的方法和装置有效
申请号: | 202010403394.0 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111582206B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 喻冬东;王长虎 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/26;G06V10/82;G06N3/0464;G06N3/045;G06N3/08 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 郭曼 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 生物体 姿态 关键 信息 方法 装置 | ||
1.一种用于生成生物体姿态关键点信息的方法,包括:
将目标图像输入至预先训练的第一深度学习网络,得到第一特征图;
对所述目标图像进行分割,得到子图像集合;
基于所述子图像集合和预先训练的第二深度学习网络,生成第二特征图;
对所述第一特征图和所述第二特征图分别进行反卷积,得到已处理的第一特征图和已处理的第二特征图;将所述已处理的第一特征图和所述已处理的第二特征图进行叠加,得到第三特征图;将所述已处理的第一特征图,所述已处理的第二特征图和所述第三特征图输入至注意力机制网络,得到第四特征图;将所述第四特征图输入至第三深度学习网络,生成生物体姿态关键点信息。
2.根据权利要求1所述的方法,其中,所述基于所述子图像集合和预先训练的第二深度学习网络,生成第二特征图,包括:
将所述子图像集合中的每个子图像输入至所述第二深度学习网络生成子图像特征图,得到子图像特征图集合;
将每个子图像特征图根据所对应的子图像在所述目标图像的空间位置进行拼接,得到所述第二特征图。
3.根据权利要求1所述的方法,其中,所述已处理的第一特征图与所述已处理的第二特征图之间的相关性是通过均方误差函数来约束的。
4.根据权利要求3所述的方法,其中,所述注意力机制网络包括:叉乘层和卷积层。
5.根据权利要求4所述的方法,其中,所述将所述已处理的第一特征图,所述已处理的第二特征图和所述第三特征图输入至所述注意力机制网络,得到第四特征图,包括:
将所述第三特征图输入至所述卷积层,得到卷积层结果;
基于所述卷积层结果和归一化指数函数,得到所述已处理的第一特征图的权重系数和所述已处理的第二特征图的权重系数;
将所述已处理的第一特征图的权重系数、所述已处理的第二特征图的权重系数、所述已处理的第一特征图和所述已处理的第二特征图输入至叉乘层,得到第四特征图。
6.根据权利要求1-5之一所述的方法,其中,所述方法还包括:
基于所述生物体姿态关键点信息,生成用于表征所述目标图像中显示的生物体姿态的生物体姿态信息。
7.根据权利要求6所述的方法,其中,所述方法还包括:
根据所述生物体姿态信息,输出用于控制目标设备进行目标操作的控制信号。
8.一种用于生成生物体姿态关键点信息的装置,包括:
输入单元,被配置成将目标图像输入至预先训练的第一深度学习网络,得到第一特征图;
分割单元,被配置成对所述目标图像进行分割,得到子图像集合;
第一生成单元,被配置成基于所述子图像集合和预先训练的第二深度学习网络,生成第二特征图;
第二生成单元,被配置成对所述第一特征图和所述第二特征图分别进行反卷积,得到已处理的第一特征图和已处理的第二特征图;将所述已处理的第一特征图和所述已处理的第二特征图进行叠加,得到第三特征图;将所述已处理的第一特征图,所述已处理的第二特征图和所述第三特征图输入至注意力机制网络,得到第四特征图;将所述第四特征图输入至第三深度学习网络,生成生物体姿态关键点信息。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010403394.0/1.html,转载请声明来源钻瓜专利网。