[发明专利]一种融合HOG和LBPH特征的身份证复印件检测方法有效
申请号: | 201810172048.9 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108388920B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 柯逍;卢安琪;牛玉贞 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/41;G06V30/19;G06V30/18;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊;薛金才 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 hog lbph 特征 身份证复印件 检测 方法 | ||
1.一种融合HOG和LBPH特征的身份证复印件检测方法,其特征在于,包括以下步骤:
步骤S1:选取大量身份证和非身份证图片作为训练样本集的正、负样本,对训练样本集中的每张图片进行尺度归一化;
步骤S2:提取尺度归一化后的训练样本的HOG特征,基于HOG特征训练SVM,得到第一分类器;
步骤S3:提取尺度归一化后的训练样本的LBPH特征,基于LBPH特征训练SVM,得到第二分类器;
步骤S4:对身份证复印件测试图像进行预处理;
步骤S5:利用第一分类器对预处理后的测试图像进行目标检测;
步骤S6:计算步骤S5的目标检测结果的LBP特征,根据得到的LBP特征生成LBPH特征;
步骤S7:利用第二分类器根据步骤S6生成的LBPH特征进行判断,保留判断结果为真的目标,得到测试图像中的身份证复印件;
所述步骤S2中基于HOG特征训练SVM,得到第一分类器的方法具体包括:
使用线性核函数,及利用如下式子:
其中,xε表示样本ε的HOG特征向量,xl表示样本l的HOG特征向量,κ表示核函数,表示xε的转置,将训练结果保存到XML文件中;
从得到的XML文件中读取数组alpha、数组support vector和浮点数rho,首先把alpha与support vector相乘,获得一个行向量,再将该向量前面乘以-1,然后在该行向量的最后添加浮点数rho,得到第一分类器;
所述步骤S4具体包括:
步骤S41:输入身份证复印件测试图像;
步骤S42:测试图像尺度归一化,利用双线性内插值算法,使用如下式子:f(λ+u,j+v)=(1-u)(1-v)f(λ,j)+(1-u)vf(λ,j+1)+u(1-v)f(λ+1,j)+uvf(λ+1,j+1)其中,λ表示测试图像上横坐标,j表示测试图像上纵坐标,λ和j均为整数,u和v均为大于等于0小于1的小数,f(λ,j)表示测试图像上像素点(λ,j)处的像素值;
步骤S43:将测试图像转换为灰度图,使用如下公式:
Gray(λ,j)=[Red(λ,j)+Green(λ,j)+Blue(λ,j)]/3
其中,Red(λ,j)表示像素点(λ,j)处的红色通道值,Green(λ,j)表示像素点(λ,j)处的绿色通道值,Blue(λ,j)表示像素点(λ,j)处的蓝色通道值,Gray(λ,j)表示灰度图中像素点(λ,j)处的灰度值;
步骤S44:进行高斯滤波平滑,利用如下式子:
其中,σ表示高斯函数的方差,Gauss(λ,j)表示经过高斯滤波处理后测试图像上像素点(λ,j)处的像素值;
所述步骤S5具体包括:
步骤S51:读取第一分类器,并对测试图像做目标检测;
步骤S52:去除检测结果中具有内外包含关系的区域,利用如下公式:
(RecteRectψ)==Recte
其中,Recte表示矩形框e,Rectψ表示矩形框ψ,如果上式判断为真则表示矩形框e与矩形框ψ是内外包含的关系,保留大的区域;
步骤S53:判断检测结果是否相交,利用如下式子:
xc1=max(xa1,xb1)
yc1=max(ya1,yb1)
xc2=min(xa2,xb2)
yc2=min(ya2,yb2)
xc1<=xc2 yc1<=yc2
其中,xa1表示矩形框a的左上角的横坐标,ya1表示矩形框a的左上角的纵坐标,xa2表示矩形框a的右下角的横坐标,ya2表示矩形框a的右下角的纵坐标,xb1表示矩形框b的左上角的横坐标,yb1表示矩形框b的左上角的纵坐标,xb2表示矩形框b的右下角的横坐标,yb2表示矩形框b的右下角的纵坐标,xc1表示矩形框a和矩形框b的左上角横坐标的最大值,yc1表示矩形框a和矩形框b的左上角纵坐标的最大值,xc2表示矩形框a和矩形框b的右下角横坐标的最小值,yc2表示矩形框a和矩形框b的右下角纵坐标的最小值,如果上式判断为真则表示矩形a与矩形b是相交的关系;
步骤S54:对检测结果中相交的区域进行融合,如果矩形框相交,求出相交面积,如果相交面积大于阈值,则对两个矩形框进行融合,使用如下式子:
xd1=min(xg1,xr1)
yd1=min(yg1,yr1)
xd2=max(xg2,xr2)
yd2=max(yg2,yr2)
其中,xd1表示融合后矩形框左上角的横坐标,yd1表示融合后矩形框左上角的纵坐标,xd2表示融合后矩形框右下角的横坐标,yd2表示融合后矩形框右下角的纵坐标,xg1表示矩形框g左上角的横坐标,yg1表示矩形框g左上角的纵坐标,xg2表示矩形框g右下角的横坐标,yg2表示矩形框g右下角的纵坐标,xr1表示矩形框r左上角的横坐标,yr1表示矩形框r左上角的纵坐标,xr2表示矩形框r右下角的横坐标,yr2表示矩形框r右下角的纵坐标;
所述步骤S2中提取尺度归一化后的训练样本的HOG特征的方法具体为:
标准化gamma空间和颜色空间并计算训练样本每一个像素的梯度,及利用如下式子:
H(s,t)=H(s,t)gamma
Gs(s,t)=H(s+1,t)-H(s-1,t)
Gt(s,t)=H(s,t+1)-H(s,t-1)
其中,s表示训练样本图像上的横坐标,t表示训练样本图像上的纵坐标,Gs(s,t)表示像素点(s,t)处的水平方向梯度,Gt(s,t)表示像素点(s,t)处的垂直方向梯度,G(s,t)表示像素点(s,t)处的梯度幅度值,α(s,t)表示像素点(s,t)处的梯度方向,参数gamma=0.5,H(s,t)表示像素点(s,t)处的像素值;
将训练样本分割成细胞单元格,再为每个单元格构建梯度方向的直方图,接着把单元格组合成块,并且块内需要归一化梯度直方图,最后生成训练样本的HOG特征向量;
所述步骤S3中提取尺度归一化后的训练样本的LBPH特征的方法具体为:
计算训练样本的LBP特征,将图像LBP分成多个编码图像,利用如下式子计算每个编码图像的像素值:
dxn=-radius*sin(2.0*π*n/neighbors)
dyn=radius*cos(2.0*π*n/neighbors)
其中,x表示图像上的横坐标,y表示图像上的纵坐标,radius表示采样半径,neighbors表示邻域大小,参数n是整数,dxn表示像素点(x,y)的第n邻域对应像素偏移横坐标,dyn表示像素点(x,y)的第n邻域对应像素偏移纵坐标,gray(x,y)表示像素点(x,y)处的灰度值,gray(x,y)n表示像素点(x,y)的第n邻域的灰度值,lbp(x,y)表示像素点(x,y)处的编码值,lbp(x,y)n表示像素点(x,y)的第n邻域的编码值,w表示LBP编码图像每个区域的宽,h表示LBP编码图像每个区域的高;
生成训练样本的LBPH特征,利用如下式子获取各个格子的宽度以及高度:
其中,gridx表示宽度方向格子数,gridy表示高度方向格子数,LBPi表示LBP编码图像中第i个编码图像区域,cols表示列数,rows表示行数,LBPi.cols表示LBP编码图中第i个编码图像区域的列数,LBPi.rows表示LBP编码图中第i个编码图像区域的行数,gradw表示格子的宽度,gradh表示格子的高度,依照行序统计各个格子中直方图每个值的高度,并按照顺序把结果存储到对应直方图矩阵的每一行;接着对直方图高度归一化;再将行作为主序把对应的直方图矩阵转变成1行M*2neighbors列的向量矩阵,M表示区域的总个数;最后连接局部直方图就得到了整个训练样本的直方图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810172048.9/1.html,转载请声明来源钻瓜专利网。