[发明专利]优化PointNet对于复杂场景的识别方法在审
申请号: | 201910744339.5 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110633640A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 颜成钢;郭凡锋;孙垚棋;张继勇;张勇东 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 33240 杭州君度专利代理事务所(特殊普通合伙) | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种优化PointNet对于复杂场景的识别方法。本方法提出用金字塔池化模块优化PointNet在复杂场景中的识别能力。将经过PointNet处理后得到的特征向量接入金字塔池化模块。金字塔池化模块能改善复杂场景解析中的开放词汇对象和填充识别的性能。利用全局文本信息基于不同区域的上下文聚合的能力。我们的全局先验表示对于在场景解析任务中产生高质量结果是有效的,对于复杂场景解析金字塔模块为整体场景解释提供了良好的描述,知识图依赖于场景上下文的先验信息,而金字塔池化模块能够聚合不同区域的上下文信息,从而提高获取全局信息的能力。因此金字塔模块的加入能让对于在三维空间中的对象分类,部分分割和语义分割等任务具有更高的准确度。 | ||
搜索关键词: | 金字塔 复杂场景 池化 聚合 解析 三维空间 场景上下文 上下文信息 准确度 先验 场景解释 场景解析 词汇对象 对象分类 模块优化 全局文本 全局信息 特征向量 先验信息 语义分割 质量结果 知识图 填充 分割 全局 优化 开放 | ||
【主权项】:
1.优化PointNet对于复杂场景的识别方法,其特征在于包括如下步骤:/n步骤1、将原始的点云数据输入到PointNet网络中,并将点云数据的n个点的三维点云作为输入,即:/nN1=3×n;其中,N1为三维点云个数,n为点云数据中点的个数;/n步骤2、对原始的点云数据应用第一次输入变换,通过一个3D空间变换矩阵预测网络T-Net(3)实现数据的对齐;对齐之后通过卷积层进行特征提取,对齐后的数据会以点为单位,通过一个共享参数的双层感知机模型进行特征提取;/n步骤3、对步骤2提取出的特征应用第二次输入变换,通过特征空间变换矩阵预测网络T-Net实现特征的对齐;对齐之后通过卷积层进行特征提取,即同步骤2一样利用三层感知机进行特征提取,得到维度为1024的特征;/n步骤4、把提取出的特征在特征空间的维度上进行最大池化聚合,提取出点云数据的全局特征向量图;/n步骤5、将提取出的全局特征向量图输入到金字塔模块中,为了充分获取全局信息,对输入的全局特征向量图进行全局平均池化处理,获取处理后的全局特征向量图;/n步骤6、利用金字塔模块来收集全局特征向量图中不同的子区域的特征表示,即用金字塔模块的不同等级将特征向量图分为不同的级别:第一级别不将特征向量图分解,第二级别将特征向量图分为四块,不同级别的输出包含具有不同大小的特征映射;为了维持全局特征的权值,在每一级别使用一个1×1卷积层来降低维度;/n步骤7、对低维特征向量图进行上采样,使其和原始输入特征图尺寸一样大小;最后将不同级别的特征向量图相连接;/n步骤8、最后通过一个卷积层得到最终输出的预测图。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910744339.5/,转载请声明来源钻瓜专利网。