[发明专利]语音信号修复方法和装置有效
申请号: | 200910140488.7 | 申请日: | 2009-05-19 |
公开(公告)号: | CN101894565A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 武穆清;李默嘉;吴大鹏;魏璐璐;甄岩;苗磊;许剑峰 | 申请(专利权)人: | 华为技术有限公司;北京邮电大学 |
主分类号: | G10L21/04 | 分类号: | G10L21/04 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 彭愿洁;李文红 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 修复 方法 装置 | ||
技术领域
本发明涉及通信技术领域,更具体地说,涉及一种语音信号修复方法和装置。
背景技术
随着无线网络技术的飞速发展,以及网络传输质量的不断提高,相比传统的有线网络,无线网络在便捷性和移动性方面已经表现出了相当巨大的优势。同时,基于无线网络的各种应用也迅速发展起来,而基于无线网络的VoIP(Voice over IP)技术便是其中之一。VoIP指的是利用IP网络进行话音传输,由于在分组网络中语音传输可以很容易地与其它业务结合,实现多媒体通信,并且以分组形式传输的语音信息利用了互联网低成本的特定,使其费用通常比传统的电话网传输要低,因此,受到了广大用户的欢迎。
但由于无线网络本身的不稳定性,导致基于无线网络的VoIP语音包的传输面临着大量的丢包情况,而当VoIP业务的丢包率超过了5%,就会对语音通信质量产生比较明显的影响,而在前向纠错已无法产生作用的时候,就需要依靠接收端通过一系列的丢包恢复技术来抵消无线网络大量丢包对语音通信质量造成的不良影响。
其中,丢包恢复技术属于丢包处理技术的一种,它指的是在已经发生了丢包的情况下,采用隐藏丢包技术,使人主观上产生一种并没有丢包的感觉的技术。对于语音信号来说,丢包恢复技术主要是利用了人类在听到不完整波形的时候的一种下意识的修复能力,在对收到的波形进行一定的改动之后,可以在相当大的程度上减轻丢包对人产生的主要影响,让接收端的人耳感官上认为并没有丢包或者丢包并不是特别严重。
在现有技术中,通常采用波形相似叠加(WSOLA)方法来进行语音信号的丢包恢复。WSOLA方法是一种在语音处理领域常用的时域拉伸方法,它是在基于语音波形相似性的前提下工作,可以保证主观质量的前提下改变语音信号的长度。其实现过程为:当接收端探测到有一个语音帧由于传输环境影响被丢弃以后,就可以利用WSOLA方法将丢失的帧之前接收到的几个完好的语音帧进行时域拉伸,使拉伸后的语音数据长度覆盖过丢失了的语音帧的位置,使得接收端的人耳听起来就好像没有丢包一样。
在实现本发明创造的过程中,发明人发现,上述方法至少存在以下问题:传统的WSOLA方法可能导致拉伸生成的语音信号幅度趋势同原音信号差距较大,而且容易在新生成的信号中造成幅度突变,从而降低了语音的质量。
发明内容
本发明实施例提供一种语音信号修复方法和装置,使在对语音信号进行恢复时,新生成的语音信号幅度趋势更加接近于原语音信号,相应提高了语音质量。
本发明实施例提供一种语音信号修复方法,包括:
将与丢失语音帧相邻近的语音帧在时域范围内进行拆分,生成多个语音段;
分别为所述语音段引入系数;
将引入系数的语音段分别与一个与自身长度相同的汉宁窗进行相乘,得出最终语音段;
将所述最终语音段进行叠加,以覆盖所述丢失语音帧所处的区域。
本发明实施例提供了一种语音信号修复装置,包括:
语音段生成单元,用于将与丢失语音帧相邻近的语音帧在时域范围内进行拆分,生成多个语音段;
系数引入单元,用于分别为所述语音段生成单元中生成的所述语音段引入系数;
汉宁窗引入单元,用于将引入系数的语音段分别与一个与自身长度相同的汉宁窗进行相乘,得出最终语音段;
语音段叠加单元,用于将所述最终语音段进行叠加,以覆盖所述丢失语音帧所处的区域。
本发明实施例通过对原语音帧进行拆分,生成语音段,并为新生成的语音段引入一个系数,将引入系数的语音段与汉宁窗相乘得出最终语音段,将所述最终语音段进行叠加以覆盖丢失语音帧所处的区域的技术手段,使叠加后的波形能够更大程度上地恢复原语音信号的幅值,从而提高语音质量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所涉及的一种语音信号修复方法的流程图;
图2为本发明实施例所涉及的另一种语音信号修复方法的流程图;
图3为本发明实施例所涉及的第三种语音信号修复方法的流程图;
图4为本发明实施例所涉及的一种语音信号修复装置的结构示意图;
图5为本发明实施例所涉及的另一种语音信号修复装置的结构示意图;
图6为本发明实施例所涉及的一种异常期判断单元的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京邮电大学,未经华为技术有限公司;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910140488.7/2.html,转载请声明来源钻瓜专利网。