[发明专利]用于预测感知视频质量的方法、系统及存储介质有效
申请号: | 201680040842.7 | 申请日: | 2016-05-09 |
公开(公告)号: | CN107852496B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 安妮·亚伦;金达;林裕杰;大卫·龙卡;安迪·舒勒;曹顾严;巫奇豪 | 申请(专利权)人: | 奈飞公司 |
主分类号: | H04N19/154 | 分类号: | H04N19/154;G06T9/00;H04N21/466 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 林强 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 感知 视频 质量 方法 系统 存储 介质 | ||
在本发明的一个实施例中,质量训练器和质量计算器协作以通过机器学习建立一致的感知质量度量。在训练阶段,质量训练器利用机器智能技术来创建感知质量模型,该感知质量模型将客观度量组合起来以最优地跟踪在训练视频的观看期间分配的主观度量。随后,质量计算器将感知质量模型应用于针对目标视频的客观度量的值,从而生成针对目标视频的感知质量得分。以这种方式,感知质量模型基于在训练阶段期间处理的视觉反馈来明智地融合针对目标视频的客观度量。由于每个客观度量对感知质量得分的贡献是基于经验数据来确定的,所以相比于传统客观度量,感知质量得分是对观测视频质量的更准确的评估。
本申请要求于2015年5月11日提交的序列号为14/709,230的美国专利申请的权益,该专利申请通过引用合并于此。
技术领域
本发明的实施例总体涉及计算机科学,并且更具体地涉及用于预测感知视频质量的技术。
背景技术
有效且准确地对源视频进行编码对于视频内容的实时传送来说是必不可少的。在经编码的视频内容被接收之后,解码并观看源视频或以其他方式对源视频进行操作。一些编码过程采用无损压缩算法(例如霍夫曼编码)以实现对源的准确复制。相比之下,为了增加压缩率和/或减小经编码的视频内容的尺寸,其他编码过程利用消除所选择的信息的有损数据压缩技术,这通常仅能够实现对源的近似重构。在视频被按比例放大到更大分辨率以匹配显示设备的尺寸的调整尺寸操作期间可能引入进一步的失真。
手动验证所传送的视频的质量是非常耗时的。因此,为了确保可接受的视频观看体验,有效且准确地预测所传送的视频的质量是可取的。因此,自动视频质量评估通常是编码和流基础架构的组成部分,编码和流基础架构用于各种过程(例如,评估编码器和微调流比特率)以保持视频质量。
在用于评估经编码的视频的质量的一种方法中,使用诸如峰值信噪比(PSNR)之类的全参考质量度量来将源视频与经编码的视频进行比较。然而,尽管这些度量准确地反映了信号保真度(即,经编码的视频相对源视频的忠实度(faithfulness)),但这些度量无法可靠地预测人们对质量的感知。例如,保真度测量通常无法反映静止场景中的视觉伪像可能比快动作场景中的视觉伪像更明显地降低观看体验。此外,由于这种感知效果,这种保真度度量是依赖于内容的,因此在不同类型的视频数据之间不一致。例如,主要由快动作场景组成的动作电影中的保真度下降比慢节奏的纪录片中的保真度下降更不明显。
如前所述,本领域需要的是用于预测视频的感知质量的更有效的技术。
发明内容
本发明的一个实施例阐述了用于估计感知视频质量的计算机实现的方法。该方法包括选择表示多个确定性视频特性的一组客观度量;对于包括在一组训练视频中的每个训练视频,接收描述该训练视频的数据集,其中该数据集包括针对感知视频质量度量的主观值和针对该组客观度量的一组客观值;从该数据集中导出复合关系,该复合关系基于针对该组客观度量的一组值来确定针对感知视频质量度量的值;对于目标视频,计算针对该组客观度量的第一组值;以及将复合关系应用于第一组值以生成针对感知视频质量度量的输出值。
所公开的用于估计感知视频质量的技术的一个优势在于定义感知视频质量度量的复合关系基于直接的人类观测来融合客观度量。更具体地,因为人类对一组训练视频的反馈指导了每个客观度量的贡献,所以将复合关系应用于目标视频概述了人类的反馈。因此,感知视频质量度量可靠地预测感知的视频质量。相比之下,传统的质量度量通常测量信号保真度,信号保真度这一特性不一定跟踪人类视觉系统所感知的视频质量。
附图说明
为了能够详细地理解本发明的上述特征的方式,可以通过参考实施例来获得上面简要概述的本发明的更具体的描述,其中一些实施例在附图中示出。然而,要注意的是,附图仅示出了本发明的典型实施例,因此不被认为是对其范围的限制,因为本发明可以允许其他等效的实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奈飞公司,未经奈飞公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680040842.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:低时延两次视频代码化
- 下一篇:用于视频数据的视频编解码方法