[发明专利]为音乐关闭DTX有效

专利信息
申请号: 201080064748.8 申请日: 2010-02-25
公开(公告)号: CN102792760A 公开(公告)日: 2012-11-21
发明(设计)人: 蒂莫·修科;约翰·贡纳·兰德斯特罗姆;阿托·马孔恩 申请(专利权)人: 瑞典爱立信有限公司
主分类号: H04W76/04 分类号: H04W76/04;G10L19/00;G10L11/02;G10L19/14
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 王波波
地址: 瑞典斯*** 国省代码: 瑞典;SE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音乐 关闭 dtx
【说明书】:

技术领域

发明涉及一种用于控制语音编码器的不连续传输模式DTX的方法,并且涉及一种用于控制对呼叫输入信号进行编码并输出已编码的呼叫输出信号的语音编码器的不连续传输模式的方法

背景技术

在大部分移动通信应用中,语音仍然是最重要的媒体组件。针对语音优化所有语音编码器以及围绕语音编码器的机制。在移动通信组件的设计中,音乐被认为是不重要的。

最近,音乐在应用中(例如在“通话保持音乐”或“回铃音音乐”中)已经变得越来越重要。

为了节省无线电和网络链路容量,开发语音活动检测器(VAD)用来辨别语音和间歇。如果检测到间歇,则不从无声部分向另一方传输信号。稍后,出现这种情况:当在其他伙伴断断续续的话语之间扬声器完全无声,用户会很不高兴。因此,创造出了舒适噪音,那是接收语音信号的终端基于不时传输的一些无声描述符,自己创造出舒适噪音。

该操作被称为不连续传输(DTX),由语音编解码器内的语音活动检测器控制。然而,VAD对于音乐信号效果不好。通常,音乐信号被错误地归类为噪音,并被舒适噪音所取代。

一个解决方案是:在呼叫的整个持续时间或仅在提示阶段期间,在下行链路方向上打开或关闭VAD/DTX。然而,针对网络中的所有呼叫禁用VAD/DTX将导致无线电干扰增加。

启用下行链路VAD/DTX使操作者可以优化无线电规划(例如,可能需要更少的无线电基站),并因此可以有利地在下行链路方向上使用DTX。为了优化的无线电容量以及为了在呼叫中正确识别音乐信号,最优解决方案是仅在向移动终端播放音乐时禁用VAD/DTX。

发明内容

因此,需要提供一种解决方案,使得能够在避免音乐信号被错误地当做背景噪音的同时优化无线电容量。

独立权利要求的特征满足该需求。在从属权利要求中,描述了本发明的优选实施例。

根据本发明的第一方面,提供了一种用于控制语音编码器的DTX模式的系统,该系统包括语音编码器,对呼叫输入信号进行编码,并输出已编码的呼叫输出信号。此外,提供了活动检测器,用于相对于呼叫输入信号中的无声信号周期的存在,确定呼叫输入信号中的声音信号周期的存在。不连续传输启用和禁用单元基于呼叫输入信号中的声音信号周期和无声信号周期来确定活动因子,并启用和禁用已编码的呼叫输出信号的不连续传输模式。如果所确定的活动因子比指定的活动因子AFs高,则不连续传输启用和禁用单元禁用不连续传输模式。利用当前要求保护的系统,可以只在向移动终端播放音乐时才禁用DTX。当语音帧和无声帧或音乐帧和无声帧之间的关系如下所示时可以区分音乐和语音:在音乐的情况中,针对音乐的无声帧的百分比远小于针对语音的无声帧的百分比。表示声音信号周期和无声信号周期的量的活动因子反映音乐在呼叫中的存在,并因此可以用于区分音乐和无声信号周期。

优选地,不连续传输启用和禁用单元被配置用于通过确定呼叫输入信号中语音和音乐信号采样与无声信号采样的关系来确定活动因子。作为示例,如果通过不连续传输启用和禁用单元所确定的活动因子高于大约75-85%或高于78-82%或高于80%,则可以禁用不连续传输模式DTX,这是因为呼叫输入信号包含音乐的可能性非常高。经发现,音乐典型地导致活动因子至少是90%,而语音的活动因子通常低于60%。将指定的活动因子AFs设置在70%到大约85%之间有助于区分语音和音乐。因此,如果所确定的活动因子高于指定的活动因子(例如,大约80%)高,则可以禁用DTX。

在本发明的一个实施例中,不连续传输启用和禁用单元使用语音活动检测器的信息来确定活动因子,该语音活动检测器配置用于区分语音和语音间歇。

在另一实施例中,活动检测器确定语音活动标记的值,如果将呼叫输入信号的时间间隔视为声音信号周期,则该语音活动标记具有第一值。如果将呼叫输入的时间间隔视为无声信号周期,则该语音活动标记具有第二值。不连续传输启用和禁用单元确定语音活动标记为第一值的时间间隔在包含呼叫输入信号的多个时间间隔的滑动时间窗内的百分比作为所述活动因子。因此,对于滑动时间窗(例如,100-200个采样的时间间隔)中的时间间隔,不连续传输启用和禁用单元确定活动因子为具有第一值或第二值。如果时间窗中超过大约80%的最近间隔的采样具有第一值,则可以将该信号视为音乐信号。如果滑动时间窗中只有40-50%或60%的最近采样具有第一值,则可以将该呼叫输入信号视为语音信号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080064748.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top