[发明专利]基于城市智慧体育的并行融合网络的姿态识别方法和系统有效
申请号: | 202111137342.4 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113887373B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 王强;王静宇;马亚中;梅一多;李慎国;谷雨明 | 申请(专利权)人: | 中关村科学城城市大脑股份有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/40;G06V10/764;G06V10/80 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 王闯 |
地址: | 100081 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 城市 智慧 体育 并行 融合 网络 姿态 识别 方法 系统 | ||
1.一种基于城市智慧体育的并行融合网络的姿态识别方法,其特征在于,包括步骤:
获取待识别骨骼图像,对所述待识别骨骼图像进行预处理得到预处理骨骼图像,待识别骨骼图像是城市体育项目中获得的体育运动员的骨骼图像;
将所述预处理骨骼图像输入至奥斯瓦德网络进行不同分辨率的特征提取,得到融合骨骼特征图像;所述奥斯瓦德网络具有两层并行计算融合结构,通过两层并行计算融合结构能够得到不同分辨率的特征图像;
将所述融合骨骼特征图像输入至agaze模块,得到不同类型通道的多个均分图像后,根据不同类型通道设置不同权重后输入至预先训练的深度学习网络进行预测,得到骨骼姿态类别;
其中,agaze模块用于对图像进行切割,所述agaze模块将得到的融合骨骼特征图像均匀分成16等分,将16等分划分为4类,通过对不同类的通道,采取不同的权值预测来体现agaze机制;
所述奥斯瓦德网络对所述预处理骨骼图像进行处理得到融合骨骼特征图像,包括步骤:
所述奥斯瓦德网络包括第一阶段和第二阶段两个阶段,两阶段按照不同分辨率进行图像特征提取;所述第一阶段和所述第二阶段并行进行;所述第一阶段按照分辨率从小到大的顺序进行,所述第二阶段按照分辨率从大到小的顺序进行;
将所述第一阶段和所述第二阶段对应得到的不同分辨率的特征图像进行融合,得到融合骨骼特征图像;
所述两阶段按照不同分辨率进行图像特征提取,包括步骤:
在第一阶段:第一部分将所述预处理骨骼图像经过预设次数的池化和卷积计算,得到预设分辨率范围和通道数范围的第一图片;第二部分将所述第一图片进行预设次数的反卷积计算后与所述第一图片进行裁剪和拼接,得到预设通道数范围的第二图片;
在第二阶段:将所述第二图片进行多次反卷积计算得到预设通道数范围和预设分辨率范围的第三图片;
将所述第三图片与所述第一图片进行融合,得到不同分辨率的融合骨骼特征图像。
2.根据权利要求1所述的基于城市智慧体育的并行融合网络的姿态识别方法,其特征在于,所述预处理骨骼图像为568*568像素、64通道的图片;所述第一图片包括第一子图片、第二子图片、第三子图片和第四子图片;所述第二图片包括第五子图片、第六子图片和第七子图片、第八子图片;
所述第一部分将所述预处理骨骼图像经过预设次数的池化和卷积计算,得到预设分辨率范围和通道数范围的第一图片,具体包括步骤:
第一步:将所述预处理骨骼图像经过池化计算得到284*284像素64通道图片,经过3*3卷积核两次卷积变成280*280像素128通道,得到第一子图片;
第二步:经过池化计算变为140*140像素128通道图片,经过3*3卷积核两次卷积变成136*136像素256通道,得到第二子图片;
第三步:经过池化计算变为68*68像素256通道图片,经过3*3卷积核两次卷积变成64*64像素512通道图片,得到第三子图片;
第四步:经过池化计算变为32*32像素512通道图片,经过3*3卷积核一次卷积变成30*30像素1024通道图片,再经过3*3卷积核一次卷积变成28*28像素1024通道,得到第四子图片;
所述第二部分将所述第一图片进行预设次数的反卷积计算后与所述第一图片进行裁剪和拼接,得到第二图片;具体包括步骤:
第五步:将所述第四子图片经过反卷积计算变为56*56像素512通道图片,与第一阶段第三步计算得到的第三子图像进行拷贝然后裁剪成56*56,拼接成1024通道,经过3*3卷积核两次卷积变成52*52像素256通道,得到第五子图片;
第六步:将第五子图片经过反卷积计算变为104*104像素256通道图片,与第一阶段第二步计算得到的第二子图像进行拷贝然后裁剪成104*104,拼接成512通道,经过3*3卷积核两次卷积变成100*100像素128通道,得到第六子图片;
第七步:将第六子图片经过反卷积计算变为200*200像素128通道图片,与第一阶段第一步计算得到的第一子图像进行拷贝然后裁剪成200*200,拼接成256通道,经过3*3卷积核两次卷积变成196*196像素64通道,得到第七子图片;
第八步:将第七子图片经过反卷积计算变为392*392像素64通道图片,与第一阶段输入的预处理骨骼图像卷积后的568*568像素64通道图片,进行拷贝然后裁剪成392*392,拼接成128通道,经过3*3卷积核两次卷积变成398*398像素64通道,得到第八子图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中关村科学城城市大脑股份有限公司,未经中关村科学城城市大脑股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111137342.4/1.html,转载请声明来源钻瓜专利网。