[发明专利]视频编码中基于人类视觉容差的编码工具选择无效
申请号: | 200810149681.2 | 申请日: | 2008-09-16 |
公开(公告)号: | CN101534448A | 公开(公告)日: | 2009-09-16 |
发明(设计)人: | 张希敏;刘明常 | 申请(专利权)人: | 索尼株式会社;索尼电子有限公司 |
主分类号: | H04N7/50 | 分类号: | H04N7/50;H04N7/68 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 宋 鹤;南 霆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 编码 基于 人类 视觉 工具 选择 | ||
技术领域
具体实施例一般涉及视频编码。
背景技术
在诸如H.264/高级视频编码(AVC)的视频压缩内,获得了比其它编 码标准高的编码效率。在AVC中,提供多个编码工具,以通过对比特流 不同地进行编码来提高压缩效率。例如,每个编码工具可以表示为压缩比 特流中的一种编码模式。编码模式选择集中关注客观速率/失真(R/D)性 能。例如,通过使用相同的比特率获得较好的峰值信噪比(PSNR)或者 通过使用较小的比特率保持相同的PSNR来测量性能。使用所述R/D手段 可以大大地提高压缩效率。然而,客观上有效的事物在视觉上不一定让用 户满意。例如,即使使用客观的R/D手段压缩视频,人眼还是可能被编码 后的视频中的失真烦扰。
发明内容
在一个实施例中,提供了一种编码模式选择方法,用于提高编码后的 视频序列的视觉质量。根据人类视觉容差度(human visual tolerance level)来选择所述编码模式。接收图像数据用于视频编码处理。然后,分 析所述图像数据以确定人类视觉容差调整信息。例如,可以根据人类视觉 容差度来调整成本方程式的参数,所述人类视觉容差度可以是基于人类视 觉系统能够容忍的失真限度的容差。
图像数据可以在认为是视觉敏感区域的位置进行分析,所述区域例如 是拖尾可疑区域、条带化可疑区域、图像边界区域和/或块化可疑区域。根 据在图像数据内找到的是何种视觉敏感区域,则可以根据不同的视觉容差 阈值来调整成本方程式中的参数。在调整了成本方程式内的参数后,计算 用于视频编码处理的成本。然后,根据成本来确定编码模式。因此,使用 基于人类视觉容差度而调整的成本方程式来选择所确定的编码模式。
通过参考说明书的剩余部分和附图可以实现对于在此公开的具体实施 例的特性和优点的进一步理解。
附图说明
图1描述了根据一个实施例的编码器的示例。
图2描述了根据一个实施例的编码器的更详细示例。
图3描述了根据一个实施例的拖尾伪影检测和视觉容差参数调整的示 例。
图4描述了根据一个实施例的用于检测条带化伪影和调整视觉容差参 数的流程图的示例。
具体实施方式
概述
图1描述了根据一个实施例的编码器100的示例。编码器100包括视 觉容差参数调整器102、成本估计器104和编码工具选择器106。
可以通过编码器100接收和编码图像数据。所述图像数据可以是任何 数据,并且可以由宏块构成。编码器100可以使用视频编码规范来编码所 述宏块。在一个实施例中,由编码器100使用H.264/AVC。虽然描述了 H.264/AVC,但是可以理解,可以使用其它的视频编码规范,诸如任何动 态图像专家组(MPEG)规范。
视觉容差参数调整器102可以分析所述图像数据,以确定是否应当调 整成本方程式中的参数。所述成本方程式可以是用于确定在编码处理中使 用的编码模式的任何量度,例如,能够量化要使用的值以确定可以使用哪 个编码模式的任何方程式。如以下更详细的描述,可以分析诸如拖尾可疑 区域、条带化可疑区域或者图像边界区域的视觉敏感区域以确定是否应当 调整成本方程式中的参数。在所述分析中,可以将图像数据的信息与视觉 容差阈值相比较。根据所述比较,可以调整所述参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社;索尼电子有限公司,未经索尼株式会社;索尼电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810149681.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半实物驾驶疲劳视景仿真系统平台
- 下一篇:热水供给系统及方法