[发明专利]一种屏幕内容图像质量评估方法有效
申请号: | 202110831904.9 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113610862B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王同罕;廖静;何月顺;周书民;徐洪珍;李祥;何剑锋;贾惠珍;李广 | 申请(专利权)人: | 东华理工大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06N20/10 |
代理公司: | 南昌卓尔精诚专利代理事务所(普通合伙) 36133 | 代理人: | 贺楠 |
地址: | 344000*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 屏幕 内容 图像 质量 评估 方法 | ||
1.一种屏幕内容图像质量评估方法,其特征在于,包括以下步骤:
(1)构建屏幕内容图像数据库;
(2)对屏幕内容图像执行文本分割函数,将屏幕内容图像分割为文本区域和图像区域;
(3)对图像区域执行图像区域质量评估函数,提取图像区域的纹理特征和图像结构特征;
(4)对文本区域执行文本区域质量评估函数,提取文本区域的清晰度和文本结构特征;
(5)随机选取一千个屏幕内容图像数据库的屏幕内容图像,将一千个屏幕内容图像的纹理特征、图像结构特征、清晰度、文本结构特征和主观质量分数输入LIBSVM软件中进行训练,获取质量评估模型;
(6)输入待评估的屏幕内容图像,经过步骤(2)、(3)和(4)处理后,将所述待评估的屏幕内容图像的纹理特征、图像结构特征、清晰度、文本结构特征和主观质量分数输入质量评估模型中,获取质量分数;
其中,所述步骤(2)具体包括以下步骤:首先,动态的设置第一阈值,通过找出所有最大稳定极值区域,其中,Qi表示第一阈值为i时的某一连通区域,Δ表示微小的第一阈值变化,v(i)为第一阈值是i时的区域Qi的变化率,当v(i)小于给定第一阈值时认为该区域Qi为最大稳定极值区域;其次,设定与区域具有相同标准二阶中心矩的椭圆的离心率的第二阈值、欧拉数的第三阈值、区域中像素数与边界框中总像素的比率的第四阈值和第五阈值、凸包中区域内像素所占的比例的第六阈值,计算最大稳定极值区域的与区域具有相同标准二阶中心矩的椭圆的离心率、欧拉数、区域中像素数与边界框中总像素的比率、凸包中区域内像素所占的比例,当计算得出的与区域具有相同标准二阶中心矩的椭圆的离心率大于第二与之、欧拉数小于第三阈值、区域中像素数与边界框中总像素的比率在下于第四阈值或大于第五阈值、凸包中区域内像素所占的比例限于第六阈值时,可确定第一文本区域;然后,设定笔画宽度变化率的第七阈值,计算第一文本区域的笔画宽度变化率,当变化率大于第七阈值时,可确认第二文本区域,最后,提取并合并所有最大稳定极值区域的第二文本区域作为文本区域,将屏幕内容图像的剩余区域合并作为图像区域;
所述步骤(3)具体包括以下步骤:
S1:提取图像区域的纹理特征,首先,通过Scharr算子计算出图像区域的梯度图,并对梯度图进行归一化:其中[]为取整运算,gmax为原梯度值的最大值,L为归一化后的最大灰度级数;接着,对图像区域的灰度图进行归一化:fmax是原灰度图中的灰度最大值;然后,构建灰度-梯度共生矩阵M,水平递增为梯度值,垂直递增为灰度值,原点位于矩阵的坐上顶点处;M定义为M(i,j)=#{(m,n)|g(m,n)=i,f(m,n)=j,m=0,1,2...M-1,n=0,1,2...N-1},其中M×N为梯度和灰度图的大小,#{}表示为集合中元素的个数,最后,提取灰度-梯度共生矩阵的统计特征包括:梯度熵灰度熵能量灰度均值梯度均值梯度标准差灰度标准差作为图像区域的纹理特征,其中,(i,j)出现的总次数归一化为出现的概率P(i,j);
S2:提取图像区域的图像结构特征,首先,对图像区域进行分块,分为大小相等的n×n个局部图像块,并对每个图像块进行局部二维离散余弦变换,以得到DCT系数,接着使用广义高斯分布模型对DCT系数进行拟合,拟合后会得到图像块的形状参数γ,将最低的10%的γ值的平均值作为第一结构特征,所有γ值的均值作为第二结构特征,然后,计算频率变化系数其中σ|X|是块的方差,μ|X|是块的均值,取的最大的10%的均值作为第三结构特征,以及将的均值作为第四结构特征,之后,为从局部图像块中获取方向信息,将DCT系数块分为低、中、高3个频带,然后计算每个频带中的平均能量:其中n为正整数,σn为频带n的方差,计算子带能量之比:取Rn的最高的10%的均值作为第五结构特征,取Rn的均值作为第六结构特征,最后,为了提取方向信息,根据径向频率变化的垂直方向沿3个方向将DCT系数分为3个部分,接着计算在3个方向的频率变化系数计算的方差,取方差最高的10%均值作为第七结构特征,以及将的方差的均值作为第八结构特征。
2.根据权利要求1所述的一种屏幕内容图像质量评估方法,其特征在于,所述步骤(4)具体包括以下步骤:
S1:提取文本区域的清晰度,首先,在x和y方向进行滤波,并对滤波后的图像比上滤波图像中的最大值进行归一化操作,归一化后的像素点值大于预先设定的阈值时,则该像素点作为可能的边缘像素,接着分别在水平方向和垂直方向计算中值滤波图像差的差ΔDoM,水平方向:ΔDoMx(i,j)=[IM(i+2,j)-IM(i,j)]-[IM(i,j)-IM(i-2,j)],垂直方向:ΔDoMy(i,j)=[IM(i,j+2)-IM(i,j)]-[IM(i,j)-IM(i,j-2)],其中,IM(i,j)是中值滤波图像在像素(i,j)处的灰度值,使用偏差为2的差异,在像素(i,j)处的x方向的清晰度定义为:在y方向的清晰度计算方式同理,其中,∑i-w≤k≤i-w|ΔDoMx(k,j)|表明在大小为2w+1的窗口上求和ΔDoM,对边缘处的对比度进行归一化,∑i-w≤k≤i+w|I(k,j)-I(k-1,j)|为在窗口大小为2w+1上的对比度,当Sx(i,j)大于预设阈值时则(i,j)处的像素点为清晰的,最后,该区域的图像的清晰度定义为:其中:#sharpPixels为清晰的像素点数,#edgePixels为边缘像素点数;
S2:提取文本区域的文本结构特征,首先,计算文本区域的梯度图GM,图像像素点(i,j)处的梯度计算如下:其中h代表梯度算子,代表卷积运算;接着在梯度图上计算旋转不变均匀的局部二值模式LBP,其中,Δ表示统一度量,U代表相邻像素数,S代表领域的半径值,ρ定义为阈值函数,Gk,GC表示为中心坐标及其邻域的GM值,接着计算GMLBP直方图,观察到GMLBP可以包含U+2个不同的模式,这些模式可以组合到直方图的一个bin中,将U设置为8,因此直方图共有10个bin,并在三个尺度下分别计算,所述三个尺度为原始图像,下采样因子为2采样后的图像,下采样因子为4采样后的图像,因此共提取30个文本结构特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110831904.9/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序