[发明专利]对图像进行美学评价的多特征融合方法有效
申请号: | 201710025626.1 | 申请日: | 2017-01-13 |
公开(公告)号: | CN106778788B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 于明;葛瑞雪;李丽莎;于洋;师硕;郭迎春;刘依 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 胡安朋 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 进行 美学 评价 特征 融合 方法 | ||
1.对图像进行美学评价的多特征融合方法,其特征在于:提取图像的色彩调和特征向量、颜色特征向量、构图特征向量、清晰度特征向量、纹理特征向量和DCT统计特征向量共六类特征向量,将提取的六类特征向量融合后利用SVM分类器将图像按美学分数高低分为两类,实现对图像进行美学评价,具体步骤如下:
第一步,输入彩色RGB图像I,并进行显著区域检测得到主体区域和背景区域:
通过USB接口向计算机输入彩色RGB图像I,大小为w×h×3像素,其中w为图像宽度,h为图像高度,不同图像的宽度w和高度h不同,采用阿里巴巴的Yang提出的基于图的流形排序显著性检测算法对输入彩色RGB图像I进行显著区域检测,得到显著区域,之后提取包含显著区域的最小外接矩形,得到主体区域If,其余为背景区域Ib,同时得到主体区域If的中心点O(Ox,Oy);
第二步,彩色RGB图像I在不同颜色空间的特征向量提取:
(2.1)提取彩色RGB图像I在HSV、LAB和Munsell三个颜色空间的色彩调和特征向量:
这里分为以下三个阶段进行:
第一阶段,图像的分块:将上述第一步中主体区域If和背景区域Ib分别转换为HSV空间中的图像Ifh和Ibh,然后分别采用循环的方式进行分块,在进行分块时,每次分块的块数为N1×N1,进而计算每个子块的颜色信息熵值和像素个数,当子块的颜色信息熵的值小于阈值Tc或子块的像素个数小于阈值S时,不再进行分块,否则,继续进行分块;
第二阶段,确定子块的主颜色:将上述第一步中的彩色RGB图像I转换到LAB空间图像ILAB进行SLIC超像素分割,得到超像素标签,并统计上述(2.1)步第一阶段中划分的各子块中超像素的标签,数量最多的超像素标签的超像素区域是该子块的主颜色区,即可得到该子块的主颜色;
第三阶段,计算色调特征向量nh和明度及彩度特征向量nvc,得到色彩调和特征向量:
将上述(2.1)步第一阶段得到的子块由HSV颜色空间转换到Munsell颜色空间,得到色调Hue、明度V和彩度C三个分量,分别提取色调特征值、明度与彩度合并的特征值,具体步骤如下:
首先,对上述(2.1)步第一阶段得到的每个子块进行色调分量Hue的特征值提取:将子块中的每个像素的色调分量值减去上述(2.1)步第二阶段中得到的该子块主颜色的色调分量值,得到该像素的色调差值HS,根据Moon-Spencer色彩调和模型,确定色调差值HS是否和谐,判断色调是否和谐的符号函数sgn公式如(1)所示:
统计与主色调和谐的像素个数,并将和谐的像素个数与当前子块总的像素个数的比作为此子块的色调分量Hue的特征值,具体公式如(2)所示:
hi=Numhi/mi,i=1,...,Z (2),
其中Numhi为第i个图像子块内色调和谐的像素点的个数,mi为该子块总的像素点的个数,当计算主体区域的色调分量Hue的特征值时,Z为主体区域的分块个数,当计算背景区域的色调分量Hue的特征值时,Z为背景区域的分块个数;
其次,对每个子块进行明度分量V和彩度分量C的特征值提取:对上述(2.1)步第一阶段得到的每个子块中的每个像素的明度值减去上述(2.1)步第二阶段中该子块主颜色的明度值得到明度差值VS,子块中的每个像素的彩度值减去上述(2.1)步第二阶段中该子块主颜色的彩度值得到彩度差值CS,将明度差值VS及彩度差值CS合并作为一个特征值根据Moon-Spencer色彩调和模型,判断明度及彩度是否和谐,公式如(3)所示:
其中,firE、secE和thirE分别是衡量像素与所属子块主颜色的明度差值VS及彩度差值CS是否落在Munsell颜色空间中三个椭圆区域内的度量值,当sgn(VS,CS)值为1时,表明当前像素点的明度及彩度和谐,统计子块i中明度及彩度和谐的像素点的个数Numvci,计算其与子块i总的像素点的个数mi的比值,得到子块i的明度及彩度的特征值vci,
vci=Numvci/mi,i=1,...,Z (4),
最后,计算所有子块的色调特征值组合得到整个图像的色调特征向量h=[h1,h2,..,hZ],并计算所有子块的明度及彩度特征值组合得到整个图像的明度及彩度特征向量vc=[vc1,vc2,…,vcZ],然后把得到的色调特征向量h、明度及彩度特征向量vc分别归一化到[0,1]区间,并将该区间进行R等分,根据落在每个子区间的色调特征值和明度及彩度特征值个数得到色调特征向量nh和明度及彩度特征向量nvc,如公式(5)、(6)所示,
nh={Nh1,Nh2,...,NhR} (5),
nvc={Nvc1,Nvc2,...,NvcR} (6),
其中,Nhi为色调特征值在第i个子区间的数量,Nvci为明度及彩度特征值在第i个子区间的数量,i=1,2,…,R,这里R取10;
色调特征向量nh和明度及彩度特征向量nvc合称为色调调和特征向量,由此完成提取图像在Munsell颜色空间的色彩调和特征向量的提取;
(2.2)提取彩色RGB图像I的构图特征向量:
对上述第一步中的彩色RGB图像I同时采用以下两个构图准则提取构图特征向量:
第一个构图准则是三分法则,步骤是:将上述第一步中彩色RGB图像I的宽度w和高度h均分为三等分,得到四个交叉点(xj,yj),根据上述第一步得到的主体区域If的中心点O(Ox,Oy),计算中心点O到三分法则的四个交叉点(xj,yj)最近的归一化欧式距离d,j=1,2,3,4,具体公式如(7)所示:
第二个构图准则是主体区域大小与整个图像大小的比,步骤是:根据上述第一步得到的彩色RGB图像I和主体区域If,计算主体区域If像素点的个数与整个彩色RGB图像I像素点的个数比ratio,具体如公式(8),
ratio=num/(w×h) (8),
其中,num为主体区域总像素点的个数;
由上述两个构图准则得到的中心点到四个交叉点最近的归一化欧式距离和主体区域与整个彩色RGB图像像素点的个数比组成构图特征向量,由此完成构图特征向量的提取;
(2.3)提取彩色RGB图像I在HSV空间的颜色特征向量:
从两方面来提取彩色RGB图像I的颜色特征向量:
第一个方面是提取颜色矩特征向量,将上述第一步中彩色RGB图像I转换到HSV颜色空间的图像Ihsv,在H、S和V三个通道上,分别计算一阶矩μ、二阶矩σ和三阶矩ε,计算公式如下式(9)所示:
其中,pj,k为第j个像素点在第k个通道上的分量,k=1,2,3分别代表H、S、V分量,由H、S和V三个通道上的一阶矩、二阶矩和三阶矩组成颜色矩特征向量,由此提取得到彩色RGB图像I在HSV空间的颜色矩特征向量;
第二个方面是提取主体和背景的颜色差异特征向量,对上述第一步中的彩色RGB图像I的主体区域If和背景区域Ib分别在R、G、B三个通道上,统计颜色直方图,直方图分为L级,L=256,根据公式(10)来衡量主体和背景的差异diffc,
其中,fl,c、bl,c分别为主体区域和背景区域在第c个通道上第l级颜色直方图的大小,c=1,2,3分别代表R、G、B分量,由R、G、B三个通道的主体和背景的差异组成主体和背景的颜色差异特征向量,由此提取得到主体和背景的颜色差异特征向量;
由上述的颜色矩特征向量和颜色差异特征向量构成彩色RGB图像I在HSV空间的颜色特征向量,由此完成彩色RGB图像I的颜色特征向量的提取;
(2.4)提取彩色RGB图像I转换为灰度图像Igray后的清晰度特征向量:
将上述第一步中的彩色RGB图像I转换为灰度图像Igray,其中的主体区域转换为灰度图像后标注为Ifgray,然后将二者分别进行快速傅里叶变换,用公式(11)计算傅里叶变换后的FFT(Igray)和傅里叶变换后的主体区域的FFT(Ifgray)中大于等于阈值T的像素点个数与所计算区域总的像素点的个数比值,得到灰度图像Igray的清晰度特征值Degray和主体区域的灰度图Ifgray的清晰度特征值Def,
其中,T=8为阈值,ngray为灰度图像Igray中大于等于阈值T的像素点的个数,nf为主体区域的灰度图Ifgray中大于等于阈值T的像素点的个数,num为主体区域总的像素点的个数,由灰度图像Igray的清晰度特征值Degray和主体区域的灰度图Ifgray的清晰度特征值Def组成灰度图像的清晰度特征向量,由此提取得到灰度图像的清晰度特征向量;
(2.5)提取彩色RGB图像I转换为灰度图像Igray后的纹理特征向量:
将上述第一步中的彩色RGB图像I转为灰度图像Igray,然后从基于Tamura纹理的特征和基于可控金字塔特征两个方面来提取其纹理特征,得到灰度图像Igray的基于Tamura纹理的粗糙度特征值、对比度特征值和方向度特征值三个基于Tamura纹理的纹理特征值,以及灰度图像Igray的子带能量向量Ee,尺度间子带的能量差向量Ec以及子带系数熵向量Ep三个基于可控金字塔纹理特征共同构成图像的纹理特征向量,由此完成提取纹理特征向量;
(2.6)提取彩色RGB图像I转换为灰度图像Igray后的DCT统计特征向量:
将上述第一步得到的彩色RGB图像I转为灰度图像Igray,对灰度图像Igray进行一次高斯滤波且经过下采样,得到宽和高各为灰度图像Igray的1/2的图像Igauss1,将得到的图像Igauss1再进行一次高斯滤波且经过下采样,得到宽和高各为Igray的1/4的图像Igauss2,然后将得到的灰度图像Igray、图像Igauss1和图像Igauss2都均分成像素大小为N2×N2的子块,然后对每个子块进行DCT变换,舍弃每个子块的直流系数,保留非直流系数,采用广义高斯模型来模拟DCT系数分布,采用灰度图像Igray均值μgray、图像Igauss1均值μgauss1、图像Igauss2均值μgauss2、灰度图像Igray平均方差图像Igauss1平均方差图像Igauss2平均方差灰度图像Igray形状参数γgray、图像Igauss1形状参数γgauss1和图像Igauss2形状参数γgauss2作为美学度量的特征,具体公式如(12)-(17)所示:
1)计算灰度图像Igray均值μgray、图像Igauss1均值μgauss1和图像Igauss2均值μgauss2:
首先,分别计算灰度图像Igray、图像Igauss1和图像Igauss2中第r子块的均值μgray,r、μgauss1,r和μgauss2,r,如下式(12)所示:
其中,dgray,r,c、dgauss1,r,c、dgauss2,r,c分别为灰度图像Igray、图像Igauss1和图像Igauss2中第r个子块中经过DCT变换后的系数,
然后,分别计算灰度图像Igray、图像Igauss1和图像Igauss2所有子块的均值μgray、μgauss1和μgauss2,如下式(13)所示:
其中,Zgray、Zgauss1、Zgauss2分别为灰度图像Igray、图像Igauss1和图像Igauss2的子块数量,由此得到灰度图像Igray均值μgray、图像Igauss1均值μgauss1和图像Igauss2均值μgauss2;
2)分别计算灰度图像Igray、图像Igauss1和图像Igauss2的平均方差和
首先,分别计算灰度图像Igray、图像Igauss1和图像Igauss2中第r子块的方差和如下式(14)所示:
然后,分别计算灰度图像Igray、图像Igauss1和图像Igauss2所有子块的平均方差和如下式(15)所示:
由此得到灰度图像Igray、图像Igauss1和图像Igauss2所有子块的平均方差和
3)分别计算灰度图像Igray、图像Igauss1和图像Igauss2的形状参数γgray、γgauss1和γgauss2:
首先,分别计算灰度图像Igray、图像Igauss1和图像Igauss2的第r个子块的形状参数γgray,r、γgauss1,r和γgauss2,r的估计和如下式(16),
其中,R(x)=Γ2(2/x)/(Γ(1/x)×Γ(3/x));
然后,分别计算灰度图像Igray、图像Igauss1和图像Igauss2所有子块的形状参数和的均值即灰度图像Igray、图像Igauss1和图像Igauss2的形状参数γgray、γgauss1和γgauss2,如下式(17)所示:
由此得到灰度图像Igray形状参数γgray、图像Igauss1形状参数γgauss1和图像Igauss2形状参数γgauss2;
综合(2.6)步中的1)、2)和3)步,完成彩色RGB图像I转换为灰度图像Igray后的DCT统计特征向量的提取;
第三步,使用支持向量机对图像进行高低美感的分类:
将第二步得到的所有特征串联起来,输入核函数为RBF的支持向量机,进行训练,在本专利中,参数s为0、t为2、c和g采用五折交叉验证法选取最佳值,得到图像美学分类模型,利用此分类模型将输入的图像分为高、低美感两类,至此实现对图像进行美学评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710025626.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序