[发明专利]聚焦于用于音频信号的音频场景的一部分有效
申请号: | 200880113925.X | 申请日: | 2008-10-29 |
公开(公告)号: | CN101843114A | 公开(公告)日: | 2010-09-22 |
发明(设计)人: | O·柯克比;J·维罗莱宁 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;H04S7/00;H04S3/00 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 杨晓光;赵鹏华 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚焦 用于 音频 信号 场景 一部分 | ||
1.一种方法,包括:
获得由多个音频源生成的输入多通道音频信号;
确定针对所述多个音频源中的每个的方向信息;
获得空间注意力的至少一个期望方向;
向所述至少一个期望方向聚焦所述输入多通道音频信号,以形成输出多通道音频信号;以及
向用户呈现所述输出多通道音频信号。
2.如权利要求1所述的方法,还包括:
围绕所述至少一个期望方向扩展音频场景的第一区域。
3.如权利要求2所述的方法,还包括:
压缩所述音频场景的第二区域。
4.如权利要求3所述的方法,还包括:
将输入方位角值重映射为输出方位角值,所述输出方位角值不同于所述输入方位角值。
5.如权利要求4所述的方法,还包括:
利用重映射函数来重映射所述输入方位角值。
6.如权利要求5所述的方法,所述重映射函数的特征在于,所述重映射函数对于所述输入方位角值的子集是非线性的,并具有大于1的导数。
7.如权利要求1所述的方法,还包括:
当呈现所述输出多通道音频信号时,保持所述输入多通道音频信号的总响度。
8.如权利要求2所述的方法,还包括:
放大关于所述音频场景的第一区域的所述输入多通道音频信号。
9.如权利要求1所述的方法,所述输出多通道音频信号包括双耳音频信号。
10.如权利要求1所述的方法,空间注意力的所述至少一个期望方向是从固定于用户的头部追踪器获得。
11.一种装置,包括:
输入模块,被配置为获得由多个音频源生成的输入多通道音频信号;
空间内容分析器,被配置为确定针对所述多个音频源中的每个的方向信息;
输入设备,被配置为获得空间注意力的期望的方向;
音频处理模块,被配置为向所述期望的方向聚焦所述输入多通道音频信号,以形成聚焦的多通道音频信号;以及
合成器,被配置为向用户呈现所述聚焦的多通道音频信号。
12.如权利要求11所述的装置,所述音频处理模块还被配置为围绕所述期望的方向扩展音频场景的第一区域;以及压缩所述音频场景的第二区域。
13.如权利要求12所述的装置,所述音频处理模块还被配置为将输入方位角值重映射为输出方位角值,所述输出方位角值不同于所述输入方位角值。
14.如权利要求13所述的装置,所述音频处理模块还被配置为利用重映射函数来重映射所述输入方位角值。
15.如权利要求14所述的装置,所述音频处理模块还被配置为利用所述重映射函数,其中所述重映射函数的特征在于,对于所述输入方位角值的子集是非线性的,并具有大于1的导数。
16.一种具有计算机可执行指令的计算机可读介质,包括:
获得由多个音频源生成的输入多通道音频信号;
确定针对所述多个音频源中的每个的方向信息;
获得空间注意力的期望的方向;
向所述期望的方向聚焦所述输入多通道音频信号,以形成输出多通道音频信号;以及
向用户呈现所述输出多通道音频信号。
17.如权利要求16所述的计算机可读介质,还包括:
围绕所述期望的方向扩展音频场景的第一区域;以及
压缩所述音频场景的第二区域。
18.如权利要求17所述的计算机可读介质,还包括:
将输入方位角值重映射为输出方位角值,所述输出方位角值不同于所述输入方位角值。
19.如权利要求18所述的计算机可读介质,还包括:
利用重映射函数来重映射所述输入方位角值,所述重映射函数的特征在于,对于所述输入方位角值的子集是非线性的,并具有大于1的导数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880113925.X/1.html,转载请声明来源钻瓜专利网。