[发明专利]一种应用于大规模城区重建中的多标签像素分类方法在审
申请号: | 201711205176.0 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107977677A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 大规模 城区 重建 中的 标签 像素 分类 方法 | ||
1.一种应用于大规模城区重建中的多标签像素分类方法,其特征在于,主要包括数据集(一);网络结构(二);训练方法(三)。
2.基于权利要求书1所述的数据集(一),其特征在于,使用分辨率大于或等于6000×6000的图像作为训练与测试图像,每张图像分别有三个对应的特征图:深度图、标签图以及彩色图像;每张图像中的每个像素会被分成以下6个类别的其中一个:建筑物、树木、道路、自然地表、人造地表和汽车,其中人造地表涵括了所有既不属于道路又同时覆盖有某种材料的区域。
3.基于权利要求书2所述的网络结构(二),其特征在于,使用一个总共具有13层的卷积神经网络以及一个线性分类器(支持向量机)构建深度神经网络,其中包括:网络初始化、卷积模块设置和网络输出三部分。
4.基于权利要求书3所述的网络初始化,其特征在于,包括网络输入的尺寸设定和网络滤窗的大小设定,具体为:
1)将输入源图像分割成连续不重叠的块(大小为N×N),本方法中N=100;
2)卷积核大小设置为k,本方法中k=5。
5.基于权利要求书3所述的卷积模块设置,其特征在于,使用不同的功能层对图像或中间数据进行处理并得到中间结果,具体为:
1)输入层:尺寸为[100×100];
2)卷积层:卷积核大小为5×5,特征图个数为6,得到中间结果尺寸为[96×96];
3)池化层:均值核大小为3×3,得到中间结果尺寸为[48×48];
4)卷积层:卷积核大小为5×5,特征图个数为12,得到中间结果尺寸为[44×44];
5)池化层:极值核大小为3×3,得到中间结果尺寸为[21×21];
6)合并层:将5)得到的12个尺寸为21×21的特征图横向连接成为向量,尺寸为
[1×5292];
7)全连接层:共2层,各层神经元的个数分别为120和6;
8)激活函数:在2)和4)这两个卷积层后,都是用非线性激活函数进行值域的映射;
综上,卷积模块的设置如公式(1)所示:
其中,p表示一个像素点,Φp表示是与六个标签相对应的值的六元组,X表示网络输入,Ψ表示卷积网络操作,Γ(·)表示全连接层操作,Πmax和Πavg分别表示最大值池化和均值池化操作,ReLU(·)表示非线性激活函数。
6.基于权利要求书3所述的网络输出,其特征在于,对于输入中的每个像素p,其对应的输出6元数组定义为:
同时,定义一个正态概率分布6元数组:
其中,每个独立的∧取值范围为[0,1];
每个像素都会产生5个集合的正态概率分布6元数组再与该像素所属图像所对应的原始标签特征图(分辨率都为6000×6000)输入到支持向量机中进行训练,学习映射函数,最终得到6种分类结果。
7.基于权利要求书1所述的训练方法(三),其特征在于,包括参数设置、标签优化和评价标准。
8.基于权利要求书7所述的参数设置,其特征在于,对数据集进行训练、测试两部分集合的划分,其二者比例为4比1;训练迭代回合数设置为300;总共训练的总样本数为400000;支持向量机的训练策略为“一对多”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711205176.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本相似度计算方法及装置
- 下一篇:用于输出信息的方法和装置