[发明专利]跨模态知识蒸馏的方法、系统、电子装置和存储介质在审
申请号: | 202211239339.8 | 申请日: | 2022-10-11 |
公开(公告)号: | CN115953586A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 李镇;颜旭;占贺深;郑超达;高建焘;崔曙光 | 申请(专利权)人: | 香港中文大学(深圳)未来智联网络研究院 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/764;G06V10/82;G06T15/00;G06N5/02 |
代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 王利彬 |
地址: | 518000 广东省深圳市福田区福保街道福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 跨模态 知识 蒸馏 方法 系统 电子 装置 存储 介质 | ||
1.一种跨模态知识蒸馏的方法,其特征在于,包括:
渲染CAD模型或从不同视角在点云上进行透视投影,获得点云对应的3D图像的多个视图的辅助图像;
将所有的所述辅助图像输入到图像网络中,获得3D图像的全局特征;
在点云和所述全局特征之间进行特征增强和分类器增强,将所述3D图像的图像特征蒸馏至点云。
2.根据权利要求1所述的跨模态知识蒸馏的方法,其特征在于,
所述获得3D图像的全局图像特征包括:
将所有的不同视角的图像放进一个卷积网络中进行特征提取,获得一些特征向量;
将所有所述特征向量通过一个聚合函数生成一个全局特征,所述全局特征包含了多视角图像中的形状信息。
3.根据权利要求1所述的跨模态知识蒸馏的方法,其特征在于,
所述将所述3D图像的图像特征蒸馏至点云包括:
将所述全局特征映射到欧式空间,并使用EMD距离监督所述映射的过程;
通过所述全局特征在所述欧式空间内重构点云。
4.根据权利要求1所述的跨模态知识蒸馏的方法,其特征在于,
所述在点云和所述全局特征之间进行特征增强和分类器增强包括:
优化分类损失、优化特征增强损失和优化分类器增强损失;
对优化后的分类损失、特征增强损失和分类器增强损失分配权重,获得最终损失函数。
5.根据权利要求4所述的跨模态知识蒸馏的方法,其特征在于,
所述优化分类损失的方法包括:
使用点编码器和分类器设计点云分析模型;
点编码器生成点云特征,并将所述点云特征输入分类器来获取一个分类网络;
将所述分类网络的交叉熵损失作为分类的损失函数。
6.根据权利要求4所述的跨模态知识蒸馏的方法,其特征在于,
所述优化特征增强损失方法的表达公式为:
其中,LFeature为特征增强损失,表示和的EMD距离,ρ为点云中的任意一个点,为点云特征通过解码器生成的点云,为图片特征通过解码器生成的点云,和具有相同大小,φ:是双射的关系。
7.根据权利要求5所述的跨模态知识蒸馏的方法,其特征在于,
所述优化分类器增强损失方法的表达公式为:
LClassifier=DKL(Clspts(Fimg)||Clspts(Fpts))
其中,Fimg为所述全局特征,Fpts为点云特征,Clspts(*)为分类器,DKL(*)表示两个分布的KL散度。
8.一种跨模态知识蒸馏的系统,其特征在于,包括:
辅助图像获取模块,用于渲染CAD模型或从不同视角在点云上进行透视投影,获得点云对应的3D图像的多个视图的辅助图像;
全局特征获取模块,将所有的所述辅助图像输入到图像网络中,获得3D图像的全局特征;
特征蒸馏模块,用于在点云和所述全局特征之间进行特征增强和分类器增强,将所述3D图像的图像特征蒸馏至点云。
9.一种电子装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至7中的任意一项所述方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7中的任意一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港中文大学(深圳)未来智联网络研究院,未经香港中文大学(深圳)未来智联网络研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211239339.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源材料领域智能工厂排程系统
- 下一篇:一种保险佣金核算方法和系统