[发明专利]一种提高混音音质的控制方法、装置及存储介质在审
申请号: | 202110150163.8 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112885329A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 丁凡;孙业全;张聚明;柯国富;沈洪辉 | 申请(专利权)人: | 广州广哈通信股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/033;H04L29/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510663 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 音质 控制 方法 装置 存储 介质 | ||
本发明公开了一种提高混音音质的控制方法、装置及存储介质,所述方法包括:接收待混音的RTP数据,对所述RTP数据进行RTP重排序、数据解码、静音检测、统一采样率和写入输入队列;其中,一个所述输入队列对应一个混音通道;计算所述输入队列中语音数据的能量值,作为对应的混音通道的权重;根据所述混音通道的权重,选择参与混音的混音通道,并设置通道状态;根据预设的混音算法,执行混音操作,将参与混音的各通道的输出语音数据分别写入对应的混音通道的输出队列中;将所述输出队列的语音数据封装为RTP数据包,发送至音频发送端。本发明通过在混音前对语音数据进行预处理和混音后进行后处理,有效提高了混音输出的音质。
技术领域
本发明涉及通信技术领域,尤其涉及一种提高混音音质的控制方法、装置及存储介质。
背景技术
语音合成技术是将各个参会者的语音数据通过混音算法混合,编码后传输给所有的参会者。语音合成技术让更多的参会者可以在同一时刻发言,并将所有发言者的信息传达给所有参会者。
传统的语音合成技术,基本上只关注混音算法本身,较少考虑其它音质相关问题,导致输出的音质质量不够高,无法满足对音质要求较高的场合的需求。
发明内容
本发明实施例的目的是提供一种提高混音音质的控制方法、装置及存储介质,通过在混音前对语音数据进行预处理和混音后进行后处理,有效提高了混音输出的音质。
为实现上述目的,本发明一实施例提供了一种提高混音音质的控制方法,包括以下步骤:
接收待混音的RTP数据,对所述RTP数据进行RTP重排序、数据解码、静音检测、统一采样率和写入输入队列;其中,一个所述输入队列对应一个混音通道;
计算所述输入队列中语音数据的能量值,作为对应的混音通道的权重;
根据所述混音通道的权重,选择参与混音的混音通道,并设置通道状态;
根据预设的混音算法,执行混音操作,将参与混音的各通道的输出语音数据分别写入对应的混音通道的输出队列中;
将所述输出队列的语音数据封装为RTP数据包,发送至音频发送端。
优选地,在所述计算所述输入队列中语音数据的能量值之前,还包括:
检查所有混音通道的通道状态,排除静音或禁止说权限的混音通道;
检查每个混音通道对应的缓存长度,获取其中的累计语音数据长度和当前语音数据长度,若累计语音数据长度短于启动混音的数据长度,或者所述当前语音数据长度短于单次混音处理的数据长度,则禁止对应的混音通道参与混音。
优选地,所述根据所述混音通道的权重,选择参与混音的混音通道,并设置通道状态,具体包括:
获取允许参与混音的总通道数量和指定必须参与混音的混音通道,计算得到剩余允许参与混音的通道数量N;其中,N≥1;
根据所述混音通道的权重按高到低,选择排序在前N个的混音通道参与混音;
根据所述输入队列的语音信息设置通道状态;其中,所述通道状态包括不参与、持续参与、等待进入、等待退出、进入和退出。
优选地,在所述根据预设的混音算法,执行混音操作之前,还包括:
控制所述通道状态为进入的混音通道的语音音量按照预设的增强速率逐渐从静音增强到正常音量;
控制所述通道状态为退出的混音通道的语音音量按照预设的减弱速率逐渐从正常音量减弱到静音。
优选地,所述将所述输出队列的语音数据封装为RTP数据包,发送至音频发送端,具体包括:
将所述输出队列的语音数据的采样率转换为通道编码的采样率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州广哈通信股份有限公司,未经广州广哈通信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110150163.8/2.html,转载请声明来源钻瓜专利网。