[发明专利]一种语义场景补全系统与方法在审
申请号: | 201811129666.1 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109447923A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘世策;胡瑜;曾一鸣;唐乾坤;金贝贝;韩银和;李晓维 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/10;G06N3/04;G06N3/08 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种语义场景补全方法和系统,包括:获取已标注的彩色图像和深度图像,作为训练数据,其中彩色图像和深度图像已标注语义分割标签和语义场景补全标签;使用训练数据训练卷积神经网络,得到语义分割模型和语义场景补全模型,将待语义场景补全的待补全图像输入至语义分割模型,得到语义分割结果;根据拍摄彩色图像的相机参数和深度图像,得到彩色图像中像素和深度图像中体素的映射关系,根据映射关系将语义分割结果投影到三维空间,得到待补全图像的语义场景表面;对语义场景表面进行离散化处理后输入至语义场景补全模型,得到待补全图像的三维结构和待补全图像中物体的类别,输出三维结构和类别作为待补全图像的语义场景补全结果。 | ||
搜索关键词: | 语义场景 语义分割 彩色图像 深度图像 图像 三维结构 训练数据 映射关系 标注 三维空间 卷积神经网络 离散化处理 补全系统 结果投影 图像输入 相机参数 全标签 像素 标签 拍摄 输出 | ||
【主权项】:
1.一种语义场景补全方法,其特征在于,包括:步骤1、获取已标注的彩色图像和深度图像,作为训练数据,其中该彩色图像和该深度图像已标注语义分割标签和语义场景补全标签;步骤2、使用该训练数据训练卷积神经网络,得到语义分割模型和语义场景补全模型,将待语义场景补全的待补全图像输入至该语义分割模型,得到语义分割结果;步骤3、根据拍摄该彩色图像的相机参数和该深度图像,得到该彩色图像中像素和该深度图像中体素的映射关系,根据该映射关系将该语义分割结果投影到三维空间,得到该待补全图像的语义场景表面;步骤4、对该语义场景表面进行离散化处理后输入至该语义场景补全模型,得到该待补全图像的三维结构和该待补全图像中物体的类别,输出该三维结构和该类别作为该待补全图像的语义场景补全结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811129666.1/,转载请声明来源钻瓜专利网。