[发明专利]信息处理设备和方法以及程序在审
申请号: | 201780060448.4 | 申请日: | 2017-09-22 |
公开(公告)号: | CN109891504A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 土田祐司 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;H04R3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;唐明英 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 信息处理设备 元数据 目标数据 音量 存储介质 电子设备 有效地 音质 校正 匹配 服务器 计算机 配置 应用 统计 | ||
本技术涉及使得能够有效地校正音量以更好地匹配听感特性的信息处理设备、方法和程序。本发明被配置成获取作为音频信号组的每个音频信号的元数据的统计值的目标数据,获取要再现的音频信号的元数据,以及通过使用所获取的目标数据和元数据来计算要再现的音频信号的音量的校正值或要再现的音频信号的音质的校正值或两者。本发明可以应用于例如信息处理设备、电子设备、计算机、服务器、程序、存储介质和系统。
技术领域
本技术涉及信息处理设备、信息处理方法和程序,并且更具体地,涉及能够获得更适合于听感特性的音量校正效果的信息处理设备、信息处理方法和程序。
背景技术
过去,在不同音频源(在音乐的情况下是音乐作品)之间调平音量(响度)并改善收听者的舒适性和便利性(例如,消除针对每个音乐作品调节音量的不便等)的技术已经开发并且投入实际使用(例如,参见专利文献1至3)。
例如,在已知的相关技术中,使用整个音乐作品的有效值来计算音量校正值。此外,在这种情况下,使用预滤波器来改善听感特性与有效值之间的相关性。作为预滤波器的特性,例如,经常使用K特性等。
引用列表
专利文献
专利文献1:JP 4981123B
专利文献2:JP 5101292B
专利文献3:JP 2016-509693T
发明内容
技术问题
然而,在相关技术中,可能难以使音量校正效果与用户的听感特性相匹配。例如,在使用K特性作为预滤波器的特性的情况下,考虑到滤波器的简单实现,通过两个双二阶滤波器的级联连接来实现K特性,并且不必然严格地反映听觉特性。因此,可能难以执行准确反映用户的听感特性的音量校正。
此外,即使使用具有不妥协特性的预滤波器来严格地再现听觉特性,在再现设备的频率特性不平坦的情况下,由于如下原因,其可能难以获得与用户的听感特性相匹配的音量校正效果:原则上它不会变成由收听者最终感知的真实有效值,除非在考虑特性的情况下计算有效值。
鉴于前述内容提出了本技术,并且本技术的目的是获得更适合于听感特性的音量校正效果。
问题的解决方案
本技术的一个方面的信息处理设备是如下信息处理设备,该信息处理设备包括:目标数据获取单元,其被配置成获取目标数据,该目标数据是音频信号组的每个音频信号的元数据的统计值;元数据获取单元,其被配置成获取再现目标的音频信号的元数据;以及校正值计算单元,其被配置成使用由目标数据获取单元获取的目标数据和由元数据获取单元获取的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。
元数据可以包括音频信号的功率谱密度和音频信号的样本值的绝对值直方图。
目标数据可以包括功率谱密度的平均值和标准偏差值以及绝对值直方图的平均值和标准偏差值。
校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图和音频信号组的样本值的绝对值直方图的平均值来计算音量的校正值。
校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图的基准峰值水平和模式值以及音频信号组的样本值的绝对值直方图的平均值的基准峰值水平和模式值来计算音量的校正值。
校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图对再现目标的音频信号的功率谱密度进行规范化,并且使用规范化的功率谱密度来计算音质的校正值。
校正值计算单元可以利用具有再现目标的音频信号的样本值的绝对值直方图的预定概率密度的值对再现目标的音频信号的功率谱密度进行规范化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780060448.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:声学场景回放方法和装置
- 下一篇:存储元件中的选择性写入