[发明专利]基于自然音视频统计的无参考音视频联合质量评价方法有效

专利信息
申请号: 202010171587.8 申请日: 2020-03-12
公开(公告)号: CN111479107B 公开(公告)日: 2021-06-08
发明(设计)人: 闵雄阔;翟广涛;杨小康 申请(专利权)人: 上海交通大学
主分类号: H04N17/00 分类号: H04N17/00;H04N21/234;H04N21/233;H04N21/44;H04N21/439;H04N21/475
代理公司: 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 代理人: 刘翠
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自然 视频 统计 参考 联合 质量 评价 方法
【权利要求书】:

1.一种基于自然音视频统计的无参考音视频联合质量评价方法,其特征在于,包括:

S1:对输入视频信号构建自然视频统计模型,所述自然视频统计模型用于对视频进行统计建模;

S2:将S1中得到的自然视频统计模型推广至自然音频统计中,对输入音频信号构建自然音频统计模型,所述自然音频统计模型用于对音频进行统计建模;

S3:利用S1中得到的自然视频统计模型及S2中得到的自然音频统计模型,构建自然音频及视频联合统计模型,所述自然音频及视频联合统计模型用于对视频和音频进行联合统计建模;

S4:分别提取基于自然音频统计模型、自然视频统计模型以及自然音频及视频联合统计模型的音视频质量特征;

S5:对S4中得到的音视频质量特征进行特征回归操作,得到最终的音视频联合质量估计。

2.根据权利要求1所述的基于自然音视频统计的无参考音视频联合质量评价方法,其特征在于,所述S1中,对输入视频信号进行正则化处理,并利用正则化后的视频信号构建空间域的自然视频统计模型;包括:

对输入视频信号进行正则化处理:

式中,I(i,j)为原始视频信号,为正则化之后的视频信号,i,j为像素索引,c是根据视频信号动态范围设定的一个用于保持除式稳定的常数;μ(i,j)及σ(i,j)分别表示视频信号的局部均值及标准差:

式中,wk,l,k=-K,…,K,l=-L,…,L表示一个二维的局部高斯窗;

利用自然视频统计特性对正则化后的视频信号进行对自然视频统计模型建模:

采用广义高斯分布对正则化后的视频信号进行描述:

式中,f(x;α,σ2)表示正则化视频信号的像素值所服从的概率密度函数;x表示正则化视频信号的像素值;α表示一个参数,用于控制分布的形状;σ表示一个参数,σ2用于控制分布的方差;Γ(·)表示如下伽马函数:

t为时序索引;

β表示以下参数:

采用非对称广义高斯分布描述与正则化后的视频信号相邻的两个样本及之间的乘积,即

式中,表示正则化视频信号的相邻像素值乘积所服从的概率密度函数,v表示一个参数,用于控制分布的形状;σl表示一个参数,用于控制左侧分布的方差;σr表示一个参数,用于控制右侧分布的方差;βl及βr表示以下参数:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010171587.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top