[发明专利]一种基于核超限学习机的快速交通标识检测方法有效
申请号: | 201710125697.9 | 申请日: | 2017-03-05 |
公开(公告)号: | CN106845458B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 段立娟;王聪聪;苗军;马伟;乔元华 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 超限 学习机 快速 交通 标识 检测 方法 | ||
1.一种基于核超限学习机的快速交通标识检测方法,其特征在于:
首先,读取原始样本图像,利用基于BING的objectness方法,筛选出可能包含交通标识的候选区域,根据阈值提取相应候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;
基于核超限学习机的快速交通标识检测方法,包括以下步骤:
步骤一,读取原始样本图像,将原图像缩放到预定义大小,计算图像的规范梯度特征即NG特征,对NG特征进行二值化处理,得到BING特征映射图;
步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BING特征映射图;
步骤三,利用第一级SVM线性模型计算步骤二得到的所有窗口的滤波分数,分数越高,包含物体的概率越大;
步骤四,根据步骤三得到的分数,在每一预定义尺寸下使用非极大值抑制算法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;
步骤五,根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并对这些窗口提取HOG特征,输入到核超限学习机中进行分类,得到检测结果;
假设有训练数据集TrainData和一组测试数据集TestData,TrainData的样本量为N,每个样本均包含交通标识,已知交通标识的Ground-truth;TestData的样本量为M,其中有不包含交通标识的样本;其中TrainData与TestData中样本属于K个类别;
分别读取TrainData和TestData中的原始样本图像,将原图像缩放到预定义大小;在不同尺度下计算图像的NG特征,每一点梯度均标准化到[0,255]之间;对NG特征进行二值化处理,得到Btraindata以及BtestData;
利用8*8大小的滑动窗口扫描得到的BtestData,得到64维大小的BING特征作为BTestfeature;然后利用8*8大小的滑动窗口扫描得到的Btraindata,当扫描框跟Ground-truth的重合率大于0.5的时候,则该样本为正样本数据;反之为负样本数据;统计不同尺度下正样本个数,得到所有剩余样本的64维BING特征作为BTrainfeature;将正样本的BING特征进行水平翻转,同时添加进BTrainfeature中;
用得到的BTrainfeature进行第一级SVM线性模型训练;利用训练得到的第一级SVM线性模型分别计算得到的BTestfeature各个窗口的滤波分数,计算公式为:
sl=ω,gl (1)
l=(i,x,y) (2)
其中:sl为滤波分数;gl为NG特征;l为窗口位置;i为预定义尺度;(x,y)为窗口坐标训练第二级SVM线性模型时,首先得到BTrainfeature在原始图像中对应的方框,该方框为可能目标框;然后,将不同尺度下对应的可能目标框根据重合率划分为正负样本;按照尺度,将BTrainfeature的正负样本重新划分为{BTrainfeature1,BTrainfeature2,…,BTrainfeature36},并分别在不同尺度下,用BTrainfeaturei进行第二级SVM线性模型训练,得到训练模型υi;根据得到的BTestfeature所对应的滤波分数,在每一预定义尺寸下使用非极大值抑制算法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;每一尺寸下物体分数的计算公式如下:
ol=υi·sl+ti (3)
其中:υi为线性模型;ti为偏差项;
根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并分别提取物体区域在TestData中所对应窗口位置的HOG特征作为TestFeature;针对TrainData,根据重合率随机采集总样本量为W的正负样本;提取正负样本的HOG的特征作为TrainFeature,用TrainFeature进行核超限学习机的训练,然后将TestFeature输入到核超限学习机中进行分类,得到检测结果;
以下为提取HOG特征的步骤:
将分数高于一定阈值的窗口区域的尺寸变换到同一个尺寸;分别计算窗口区域的HOG特征;首先将窗口区域灰度化,然后分别计算灰度图像中的每个像素的梯度,包括大小和方向;
图像中像素点(x,y)梯度为:
Gx(x,y)=H(x+1,y)-H(x-1,y) (4)
Gy(x,y)=H(x,y+1)-H(x,y-1) (5)
式中Gx(x,y)、Gy(x,y)、H(x,y)分别表示输入图像中像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值;像素点(x,y)处的梯度幅值和梯度方向分别为:
把窗口区域分割成若干个像素的单元格,把梯度方向平均分成9个区间,在每个单元格里面对所有像素的梯度方向在各个区间用直方图进行统计,得到一个9维的特征向量,将相邻的4个单元格构成一个块,把一个块内的向量连接起来得到4*9=36维的特征向量,用块对样本图像进行扫描,扫描步长设置为1个单元;最后将所有的特征串联起来,就得到当前图像块的HOG特征表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710125697.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便更换灯泡的路灯装置
- 下一篇:一种道路施工用的可伸缩照明灯支架