[发明专利]一种VOIP服务器端同步混音转发方法无效
申请号: | 200810028221.4 | 申请日: | 2008-05-22 |
公开(公告)号: | CN101282386A | 公开(公告)日: | 2008-10-08 |
发明(设计)人: | 李中华;李宇;陈建铭;谭洪舟 | 申请(专利权)人: | 中山大学 |
主分类号: | H04M7/00 | 分类号: | H04M7/00;H04L29/06 |
代理公司: | 广州市深研专利事务所 | 代理人: | 陈雅平 |
地址: | 510275广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 voip 服务器端 同步 转发 方法 | ||
技术领域
本发明属于语音信号处理技术领域。
背景技术
随着网络技术的发展,VOIP(Voice over Internet Protocol)由于其低廉的通话费用和良好的网络融合性,越来越有取代传统PSTN电话的趋势。基于IP网络的电话会议系统利用企业原有的网络线路和设备进行多方通话会议,将为企业节省巨额的电话费用。通话者只要通过PC终端或VoIP电话终端就可以进行会议,非常方便。
现有网络设备的速度和带宽完全可以进行基于IP网络的电话会议。随着芯片厂家的推动,基于WI-FI的各种移动VOIP终端和其它固定的VoIP终端的价格将不断下降,这将大大方便企业召开会议,增强企业内部的事务传达和交流。
实现IP网络的电话会议系统的关键是服务器的同步混音算法,它需要克服网络之间的抖动(network jitter)及延时,多路语音信号与服务器之间的时钟倾斜(clock skew),输入语音的活动情况所造成的不同步问题。此外,混音算法的高效性也非常重要。
发明内容
针对后前面所述三个方面即网络之间的抖动(network jitter)及延时,终端与服务器之间的时钟偏差造成的时钟倾斜(clock skew)和输入语音的活动情况,本发明提出了一种更加高效的VOIP服务器端同步混音转发方法,它的主要步骤包括:
1)从RTP端口取出的语音帧通过信道被解码,再进行信源解码得到原始语音波形;
2)结合语音帧的时间信息和Playout Calc计算出延迟时间Playouttime;
3)结合信源解码的语音波形和Playout time,通过Clock Skew Calc计算出clock skew的当前状态Skew status;
4)设计循环缓冲器来处理混音数据;
5)最后混音器Mixer利用skew status和playout time来控制多个循环缓冲器的标志位,把当前要的语音波形累加到标志位限定的区间,完成混音,输出的多路混音帧分别被转发到相应的终端。
所述步骤2)Playout Calc模块针对网络抖动,采用延时的估计和补偿机制,通过对一帧内的最先和最后一个数据包的延时估计,收到任何错误纠错包之前的延时估计和网络队列的抖动和路由器的改变所引起的包间变化估计,采用分类补偿,算出Playout time,消除以上网络因素对混音处理的影响。
所述步骤3)中Clock Skew Calc采用时钟倾斜的估计和补偿机制,通过利用指数滑动平均估计,算出时钟倾斜的状态,消除其对混音处理的影响。
所述步骤4)中的循环缓冲器包括公共循环缓冲器和分别给每路终端建立的循环缓冲器。
所述步骤5)建立公共循环缓冲器标志位与各个终端循环缓冲器标志位之间的同步更新机制来保持各个循环缓冲器之间的同步。
本发明的有益效果为:通过同步机制的使用,使得服务器能够对多路语音数据进行同步混音,并同步被转发到各个与会终端,使得IP网络语音会议在实际应用中更加广泛。
附图说明
图1为VOIP服务器端同步混音转发方法示意图;
图2为Mixer模块中的循环缓冲器结构。
具体实施方式
下面结合附图对本发明进行进一步阐述。
如图1所示,从RTP端口取出的语音帧一方面被进行信道解码,然后再进行信源解码得到原始语音波形,另一方面用语音帧的时间信息用来计算playout time。用信源解码的语音波形和playout time计算出clockskew的当前状态,最后混音器Mixer利用skew status和playout time来控制多个循环缓冲器的标志位,把当前要的语音波形累加到标志位限定的区间,完成混音,输出的多路混音帧分别被转发到各自的终端。
Playout Calc模块主要计算出由于网络抖动和延时等因素造成的滞后播放时间。
Clock Skew Calc模块则依据终端与服务器端中,每两帧数据的时间戳差来判断skew状态(fast,slow,none)。
Mixer模块中的循环缓冲器如图2所示。
本发明主要采用以下技术来实现多路语音的混音及发送:
1.网络抖动(network jitter)延时的估计,监控和分类补偿机制;
2.采用时钟倾斜(clock skew)的监控和补偿机制;
3.设计循环缓冲区来处理存放混音数据;
4.保持各个循环缓冲区之间的同步。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810028221.4/2.html,转载请声明来源钻瓜专利网。