[发明专利]人体姿势估计方法、装置、设备及存储介质有效
申请号: | 202010134710.9 | 申请日: | 2020-03-02 |
公开(公告)号: | CN111339969B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 黄少光;许秋子 | 申请(专利权)人: | 深圳市瑞立视多媒体科技有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
地址: | 518054 广东省深圳市南山区粤海街道沙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人体 姿势 估计 方法 装置 设备 存储 介质 | ||
本发明涉及计算机视觉领域,公开了一种人体姿势估计方法、装置、设备及存储介质,用于解决现有的人体姿势估计方式成本高和计算效率低的问题。人体姿势估计方法包括:通过预置的人体特征处理网络结构和热度图网络结构,构建深度学习网络模型,人体特征处理网络结构包括网络输入层、具有一个卷积核大小为3*3、多个卷积核大小为1*1和一个最大池化核大小为2*2的茎网络层Stem以及卷积核大小均为1*1的初始网络层Inception‑A,热度图网络结构用于指示两个特征拼接阶段的残差网络ResNet;通过人体特征处理网络结构对获取的人体图像信息进行特征提取获得人体特征;通过热度图网络结构生成人体特征的人体热度图;对人体热度图进行人体姿态估计获得人体的关键点。
技术领域
本发明涉及计算机视觉领域,尤其涉及一种人体姿势估计方法、装置、设备及存储介质。
背景技术
随着机器视觉和深度学习的人工智能技术的快速发展,人体姿势估计技术也随之快速发展,且在虚拟现实技术、三维虚拟场景人机交互技术或其他体姿交互的应用领域中具有重要意义。人体姿势估计技术广泛应用于基于机器视觉对人体进行定位识别,结合深度学习或其他技术进行人体姿态估计的项目中,例如:多人姿态估计系统Alphapose的人体姿势估计项目、姿态识别系统kinect的姿态识别项目和肢体语言识别系统OpenPose的人体检测项目。
在现有技术中,结合深度学习或其他技术进行人体姿态估计的项目在一些应用场景下都各有优点,但也存在着一些缺点,比如:姿态识别系统kinect需要深度相机开发成本和硬件成本较高,开发者不能从底层进行开发,只能基于姿态识别系统kinect的基础上进行开发;多人姿态估计系统Alphapose和肢体语言识别系统OpenPose存在着计算量大、对显卡资源需求很高的缺点。由于现有的人体姿势估计方式需要采用深度相机,以及所运用的系统对参数的计算量大,因而,导致现有的人体姿势估计方式存在成本高和计算效率低的问题。
发明内容
本发明的主要目的在于解决现有的人体姿势估计方式成本高和计算效率低的问题。
本发明第一方面提供了一种人体姿势估计方法,包括:
通过预置的人体特征处理网络结构和热度图网络结构,构建深度学习网络模型,所述人体特征处理网络结构包括网络输入层、茎网络层Stem和初始网络层Inception-A,所述网络输入层用于将尺寸大小为368*368*3的人体特征图输入到所述茎网络层Stem中,所述茎网络层Stem包括一个卷积核大小为3*3的卷积层、多个卷积核大小为1*1的卷积层和两个最大池化层,所述两个最大池化层中的一个最大池化层的最大池化核大小为2*2,所述初始网络层Inception-A包括多个卷积核大小均为1*1的卷积层和一个均值池化核大小为1*1的均值池化层,所述热度图网络结构包括第一特征拼接阶段的残差网络ResNet和第二特征拼接阶段的残差网络ResNet;
获取人体图像训练数据集,根据所述人体图像训练数据集对所述深度学习网络模型进行训练,获得人体姿态估计模型;
获取待处理的人体图像信息,通过所述人体姿态估计模型中的人体特征处理网络结构对所述待处理的人体图像信息进行特征提取,获得人体特征;
通过所述人体姿态估计模型中的热度图网络结构,生成所述人体特征的人体热度图;
对所述人体热度图进行人体姿态估计,获得人体的关键点。
可选的,在本发明第一方面的第一种实现方式中,所述茎网络层Stem包括第一特征拼接层、第二特征拼接层和第三特征拼接层,所述第一特征拼接层包括一个卷积核大小为3*3的卷积层、三个卷积核大小为1*1的卷积层和一个最大池化核大小为2*2的最大池化层,所述第二特征拼接层包括六个卷积核大小为1*1的卷积层,所述第三特征拼接层包括一个步长为2的最大池化层和一个卷积核大小为1*1的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市瑞立视多媒体科技有限公司,未经深圳市瑞立视多媒体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010134710.9/2.html,转载请声明来源钻瓜专利网。