[发明专利]会议混音方法以及系统在审
申请号: | 202010997726.2 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112118264A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 耿昌明;胡小鹏;顾振华 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
地址: | 215011 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 方法 以及 系统 | ||
本发明提供一种会议混音方法以及系统,应用于中心服务器处的会议混音方法包括:接收各与会终端发送的音频码流,所述音频码流包括音频数据、音频激励标志以及音频能量值;获取根据所述音频激励标志以及音频能量值从各与会终端的音频码流中选择N路音频码流,获取所述N路音频码流,其中,N为大于1且小于等于与会终端数量的整数;将所获取的N路音频码流发送至各与会终端,供各与会终端进行混音和播放。本发明提供的会议混音方法以及系统提高终端利用率,释放中心服务器的处理压力的同时,保障会议过程中的语音稳定性。
技术领域
本发明涉及多媒体信息通信领域,尤其涉及一种会议混音方法以及系统。
背景技术
传统视频会议系统包括多点控制单元(Multi Control Unit,MCU)、终端和通信网络,使用的会话协议为H.323/SIP。传统视频会议过程中终端只收发一路音频码流,由MCU服务器负责所有的音频编码、转码、解码、混合等复杂逻辑,服务器压力比较大,需要较高的配置,而对于与会终端数量较大的会议就需要耗费大量的中心节点媒体资源,性价比非常低,且转码过程增加了音频的延时。现有选择性转发单元(Selective Forwarding Unit,SFU)的混音方案都是由终端决定要订阅的对象,在与会终端数量较大的会议中,终端会频繁切换订阅对象,导致服务器信令通道压力非常大,且切换过程中语音丢失情况会非常突出。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种会议混音方法以及系统,提高终端利用率,释放中心服务器的处理压力的同时,保障会议过程中的语音稳定性。
根据本发明的一个方面,提供一种会议混音方法,应用于中心服务器处,包括:
接收各与会终端发送的音频码流,所述音频码流包括音频数据、音频激励标志以及音频能量值;
根据所述音频激励标志以及音频能量值从各与会终端的音频码流中选择N路音频码流,获取所述N路音频码流,其中,N为大于1且小于等于与会终端数量的整数;
将所获取的N路音频码流发送至各与会终端,供各与会终端进行混音和播放。
在本发明的一些实施例中,所述接收各与会终端发送的音频码流之前还包括:
创建一虚拟混音选择器,所述根据所述音频激励标志以及音频能量值从各与会终端的音频码流中选择N路音频码流的步骤由所述虚拟混音选择器执行,其中,各所述与会终端订阅所述虚拟混音选择器选择的N路音频码流。
在本发明的一些实施例中,所述虚拟混音选择器部署在所述中心服务器或与会终端。
在本发明的一些实施例中,所述根据所述音频激励标志以及音频能量值从各与会终端的音频码流中选择N路音频码流包括:
获取当前选择的N路音频码流的音频激励标志和/或音频能量值;
根据所述音频激励标志和/或音频能量值判断该音频码流是否存在发言者;
若否,则从未被选择的多路音频码流中选择一路音频码流替换该音频码流。
在本发明的一些实施例中,所述根据所述音频激励标志和/或音频能量值判断该音频码流是否存在发言者包括:
判断所述音频激励标志是否指示该音频码流属于语音信号;或者
判断所述音频能量值是否在预设时间段内皆大于等于预设能力阈值。
在本发明的一些实施例中,所述从未被选择的多路音频码流中选择一路音频码流替换该音频码流包括:
将所述音频激励标志指示该音频码流属于语音信号的未被选择的多路音频码流,按所述音频能量值自大至小进行排序,形成第一音频码流序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010997726.2/2.html,转载请声明来源钻瓜专利网。