[发明专利]信号编码方法及设备有效
申请号: | 201510662031.8 | 申请日: | 2013-05-30 |
公开(公告)号: | CN105225668B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 王喆 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/012 | 分类号: | G10L19/012 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 编码 方法 设备 | ||
技术领域
本发明涉及信号处理领域,并且具体地,涉及信号编码方法及设备。
背景技术
非连续传输系统(Discontinuous Transmission,DTX)是一种被广泛应用的语音通信系统,能够在语音通信的静音期间采用非连续的编码和传输语音帧的方式减少信道带宽的占用,同时仍能够保证足够的主观通话质量。
语音信号通常可以分为两类,即活动语音信号和静音信号。活动语音信号是指包含有通话语音的信号,而静音信号则是指不含有通话语音的信号。在DTX系统中,对活动语音信号采用连续传输的方法进行传输,对静音信号采用非连续传输的方法进行传输。这种对静音信号的非连续传输,是通过编码端间歇地编码并发送一种叫静音描述帧(Silence Descriptor,SID)的特殊编码帧来实现的,两个相邻的SID帧之间DTX系统不会编码任何其它的信号帧。解码端根据非连续接收到的SID帧自主地生成令用户主观听觉舒适的噪声。这种舒适噪声(Comfort Noise,CN)并非以如实的还原原始静音信号为目的,而是为了满足解码端用户的主观听觉质量要求,不要有不适感。
为了在解码端获得更好的主观听觉质量,由语音活动段到CN段的过渡质量是至关重要的。为了获得更平滑的过渡,一种有效的方法是:在由语音活动段过渡到静音段时,编码端不立即过渡到非连续传输状态,而是额外延迟一段时间。在这段时间内,静音段开头的部分静音帧仍然被视作语音活动帧连续的编码和发送,即设置一个连续传输的拖尾区间。这样做的好处是解码端可以充分地利用这段拖尾区间内的静音信号更好地估计和提取静音信号的特征,以生成更优的CN。
但是,在现有技术中没有对拖尾机制进行高效的控制。拖尾机制的触发条件是比较简单的,即通过简单地统计在语音活动结束时是否有足够数量的语音活动帧被连续地编码和发送来确定是否触发拖尾机制,而触发拖尾机制后,固定长度的拖尾区间就会被强制执行。然而,并非有足够数量的语音活动帧被连续地编码和发送就一定需要执行固定长度的拖尾区间,例如在通信环境的背景噪声比较平稳时,即使不设置拖尾区间或设置较短的拖尾区间,解码端也能获得优质的CN。因此,这种对拖尾机制的简单控制模式造成了通信带宽的浪费。
发明内容
本发明实施例提供信号编码方法及设备,能够节省通信带宽。
第一方面,提供了一种信号编码方法,包括:在当前输入帧的前一帧的编码方式为连续编码方式的情况下,预测在所述当前输入帧被编码为静音描述SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,其中所述当前输入帧为静音帧;确定所述舒适噪声与所述实际静音信号的偏离程度;根据所述偏离程度,确定所述当前输入帧的编码方式,所述当前输入帧的编码方式包括拖尾帧编码方式或SID帧编码方式;根据所述当前输入帧的编码方式,对所述当前输入帧进行编码。
结合第一方面,在第一种可能的实现方式中,所述预测在所述当前输入帧被编码为SID帧的情况下解码器根据所述当前输入帧生成的舒适噪声,并确定实际静音信号,包括:预测所述舒适噪声的特征参数,并确定所述实际静音信号的特征参数,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数是一一对应的;
所述确定所述舒适噪声与所述实际静音信号的偏离程度,包括:确定所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据所述偏离程度,确定所述当前输入帧的编码方式,包括:在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离小于阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述SID帧编码方式,其中所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离与所述阈值集合中的阈值是一一对应的;在所述舒适噪声的特征参数与所述实际静音信号的特征参数之间的距离大于或等于所述阈值集合中对应阈值的情况下,确定所述当前输入帧的编码方式为所述拖尾帧编码方式。
结合第一方面的第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述舒适噪声的特征参数用于表征以下至少一种信息:能量信息,谱信息。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述能量信息包括码激励线性预测CELP激励能量;
所述谱信息包括以下至少一种:线性预测滤波器系数,快速傅立叶变换FFT系数,修正离散余弦变换MDCT系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510662031.8/2.html,转载请声明来源钻瓜专利网。