[发明专利]一种基于视频生成毫米波雷达数据的方法及装置在审
申请号: | 202211719956.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116310941A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 赵东;马华东;韩乔岳;邓凯凯;张紫涵;王书岳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/20;G06V10/40;G06V10/74;G06N3/048;G06N3/0464;G06N3/08 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 生成 毫米波 雷达 数据 方法 装置 | ||
1.一种基于视频生成毫米波雷达数据的方法,其特征在于,包括以下步骤:
S1、采用变种孪生网络提取视频中的关键数据片段;
S2、利用人体区域索引算法实现人体网格数据和人体位置信息的一对一匹配;
S3、利用人体网格模型和深度预测模型生成相应的深度信息、雷达横截面和径向速度;
S4、采用多人反射模型模拟雷达信号的多径反射和衰减,输出可转换的粗糙雷达数据;
S5、使用Transformer模型生成逼真的雷达数据。
2.根据权利要求1所述的基于视频生成毫米波雷达数据的方法,其特征在于,步骤S1中变种孪生网络包括两个子网络,第一个子网络将选取的关键帧依次通过卷积层获取相应的特征向量集合;第二个子网络计算不同特征向量之间的欧氏距离获取距离向量集合,并将获取的距离向量集合通过全连接层得到关键帧之间量化的标量集合;随后,标量集合作为sigmoid函数的输入输出相应的对比矩阵;最后,利用广度优先搜索算法聚类对比矩阵以输出视频中的关键数据片段。
3.根据权利要求2所述的基于视频生成毫米波雷达数据的方法,其特征在于,步骤S1采用变种孪生网络提取视频中的关键数据片段的具体过程为:
S11、对一个输入视频,将其切分成n个片段,并从每个片段中抽取一帧作为关键帧,即可获得该视频的n个关键帧;
S12、第一个子网络使用16层卷积从n个关键帧中提取出特征向量集合{f1,f2,...,fn};
S12、利用不同特征向量之间的欧氏距离,使用公式(1)计算出距离向量集合{z1,2,...,z1,n,z2,3,...,z2,n,...,zn-1,n};
S13、使用对比损失函数计算关键帧之间的相似度,如公式(2)和(3)所示,获取一个标量集合{l1,2,...,l1,n,l2,3,...,l2,n,...,ln-1,n};
L(W,(Y,xn-1,xn)i)=(1-Y)LS(zn-1,n(xn-1,xn)i)+YLD(zn-1,n(xn-1,xn)i)
(3)
其中,(Y,xn-1,xn)i代表第i个样本,其包括一个输入对xn-1,xn和一个代表这两个输入是否属于同一类别的标签Y,W代表模型参数,LS代表当这两个输入属于同一类别时的损失函数,LD代表不同类别时的损失函数;
S14、使用sigmoid函数对标量集合进行归一化,得到一个对角线为零的上三角对比矩阵;
S15、利用广度优先搜索算法对对比矩阵进行聚类,得到关键视频片段。
4.根据权利要求1所述的基于视频生成毫米波雷达数据的方法,其特征在于,步骤S2中利用人体区域索引算法实现人体网格数据和人体位置信息的一对一匹配的具体过程为:
S21、对输入的视频帧使用目标检测模型识别出每个人体边界框,并从第一帧视频开始,为每个出现的人体边界框分配一个唯一的索引;
S22、在每一个即将到来的帧Fi中,计算第Fi帧与第Fi-1帧中边界框的位置偏移和区域偏移,以此将第Fi帧中的每一个边界框与之前分配的相应索引相匹配;如果第Fi帧中出现了一个之前没有见过的目标,那么将给该目标自动分配一个新的索引;
S23、根据索引顺序输出第Fi帧中的所有人体边界框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211719956.8/1.html,转载请声明来源钻瓜专利网。