[发明专利]一种停车位占用图像智能识别的方法在审
申请号: | 201711067986.4 | 申请日: | 2017-11-03 |
公开(公告)号: | CN107784290A | 公开(公告)日: | 2018-03-09 |
发明(设计)人: | 张烨;许艇;程康;郭艺玲;董敏;刘齐齐 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G08G1/14 |
代理公司: | 杭州之江专利事务所(普通合伙)33216 | 代理人: | 林蜀 |
地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 停车位 占用 图像 智能 识别 方法 | ||
1.一种停车位占用图像智能识别的方法,包括如下步骤:
步骤一,通过视觉设备获取对应停车位的实时影像,将图像灰度化;
步骤二,在图片的指定位置对灰度图像进行裁剪,并将图片缩放到固定的像素:宽为W,高为H;
步骤三,将统一大小的图片,进行图片数据批量标准化处理,具体过程如下:
步骤3.1确定每次处理的图片数量为m张,每张图片包含有宽高的像素点信息,定义图片集合:
X=[x1,x2,...xi...,xm]
其中,xi为第i张图片的所有像素信息;
用以下表达式将每张二维图片像素信息按照从左往右,从上到下顺序平摊为一维像素信息:
其中η=W*H,表示一张图片像素信息的总长度;xil表示第i张图片的第l位置的一维像素信息;
通过将每张图片的一维像素信息缩放为0到1,得到白化处理的结果:
ci=xi/255;
图片集合X的白化处理结果矩阵为:
CX=[c1,c2,...ci,...cm]
步骤3.2计算图片集合白化处理结果矩阵CX的均值:
其中,K表示当前批次;表示当前批次中第i张图片白化处理结果的均值,即:
步骤3.3计算图片集合白化处理结果矩阵CX的方差:
步骤3.4进行图片数据批量标准化处理,用于加快网络训练:
图片数据批量标准化处理结果用于神经网络的输入;
步骤四,对所述当前批次K的图片数据批量标准化结果重新转换回二维数据,即宽为W、高为H,进行卷积操作:
步骤4.1设定方形卷积核的边长大小值为size,设定卷积核核心起始位置为所述二维数据矩阵左上角第一个位置,设定卷积核滑动的距离为stride,设定滑动顺序为从左到右,从上到下;
步骤4.2设定隐含层神经元的节点个数Node1,用于表示卷积核对所述当前批次二维数据进行卷积操作,实现加权求和,提取拥有节点个数的图片细节特征,卷积的计算公式为:
其中r为卷积核核心在二维数据矩阵的横坐标,c为卷积核核心在二维数据矩阵的纵坐标,Kernelsize×size表示设定的卷积核,bias表示实现加权求和的偏置;
步骤五,需要对卷积操作后的特征进行激活,有目的地将有用的图片特征信息表达出来,通过给定的Relu滤波器,将大于某阈值的有用信息进行激活处理,小于阈值的进行抑制,其Relu滤波器激活公式为:
Activerc=max(0,Converc)
其中最终激活后的坐标数据矩阵记为Active,max(0,Converc)为滤波激活函数,即矩阵中数值以所述阈值为0进行滤波,取当前值和阈值中的最大值;
步骤六,将激活后的Active数据矩阵进行池化降维操作,提高特征计算效率,池化降维操作采用最大池化操作,计算公式为:
其中kernelSize×Size为设定的池化核,表示最大池化操作,将池化核内部矩阵中最大值输出,设定与卷积不同的边长Size,r'为池化核核心在激活后的Active二维数据矩阵的横坐标,c'为池化核核心在激活后的Active二维数据矩阵的纵坐标,设定不同滑动距离Stride,在所述激活后的二维Active矩阵上进行滑动,降维后的最大池化数据维度大小计算公式为:
W'=W/Stride,H'=H/Stride
其中W'为最大池化输出后的新宽度,H'为最大池化输出后的新高度;
步骤七,重复步骤四到步骤六两次,设定这两次的隐含层神经元节点数分别为Node2和节点数Node3,设定每次卷积核的大小和滑动距离等与步骤四同,设定池化核的大小和滑动距离与步骤六同,最后输出的节点大小为W”'=W/Stride3,H”'=H/Stride3;
步骤八,设置全连接层节点数为Node4,用于连接隐含层节点,这时需要将二维Pool的W”'和H”',重新调整形状到一维的[m,W”'*H”'*Node4]大小;设定输入数据格式为:
{(x(1),y(1))...(x(i),y(i))...(x(m),y(m))},1≤i≤m
其中y(i)表示第i张图片准确的类别标签,标签取值为“0”或“1”,“0”表示当前该车位无车,“1”表示当前该车位有车,为p+1维向量(第一项“1”为加权偏置),其中T表示转置,p=W”'*H”'*Node4表示该全连接层的纵向维度,表示第i张图片所对应p位置的像素信息处理后的数据;对于给定的输入样本信息设定对应位置的参数权值θ=(θ0,θ1,θ2,...,θp)T,则加权公式:
其中,θ0表示所述第一项加权偏置值,θ1到θp表示到对应位置的权值;
步骤九,设定输出层的节点数设置为类别数,最后车位有无车辆停放的判断,是将该输出层权值求和归一化到1,即某一类预测的权值越大,所占分值比重越大,则概率越大,就表示归属于该类别;输出的结果即逻辑分类属于第几类的概率,这里的类别表示训练时的标签如空车位记为“0”,有车记为“1”,用于划分类别,将概率最高的评判为本次神经网络预测值,即输出分类结果;
步骤十,预测分类结果与实际结果有所差距,需要将预测的输出分类结果与实际的标签进行比较,从而得到反馈调节的误差;以下公式用于计算预测结果与实际结果的误差量:
步骤10.1误差的计算公式为:
其中hθ(x(i))为逻辑回归问题,即0/1的二分类问题,有:
其中表示回归分类为第“1”类有车的概率,表示回归分类为第“0”类没有车的概率;
步骤10.2那么对于第i组图片样本,所述假设函数表征正确的组合对数概率为:
其中,I{y(i)=1}和I{y(i)=0}代表示性函数,简单理解为{}内的条件成立时,取1,否则取0;那么对于m张图片样本而言,我们就可以得到模型对于整体训练样本的表现能力:
步骤10.3由式(2)表征正确的概率含义可知,其值大小表征模型对数据的表达能力;在参数更新或衡量模型优劣时需要一个能充分反映模型表现误差的损失函数,而且损失函数越小越好,所述损失函数计算公式为:
其中J(θ)为交叉熵损失函数,用于表示车位情况预测与所述准确类别标签y(i)的误差量,通过对交叉损失函数进行求导,可得反向传递误差,通过该反向传递误差来调整权值,进而缩小误差量;
将式(1-2)和(1-3)代入式(3)中,化简得到:
步骤十一,利用式(4)计算J(θ)对各神经网络层第j个权值参数分量θj求偏导,最后化简得到其表示反向传递误差,用于更新隐含层、全连接层的权值、偏置,得到如下的更新公式:
其中α表示设定的更新系数,即传统意义上的学习速率;
不断地迭代,调整权值、偏置,当满足J(θ)<ε时停止训练,其中ε为设定的误差大小,利用步骤十输出的概率最高的一类判定为车位回归预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711067986.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:建立业务流的转发路径的方法和装置
- 下一篇:一种元数据的传输方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序