[发明专利]一种用于语音通信系统的音质优化装置在审
申请号: | 201711152325.1 | 申请日: | 2017-11-19 |
公开(公告)号: | CN107920176A | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 梁友仁;吕前进;刘健旭;高友;胡双喜;朱清晨;程贝贝;杨越 | 申请(专利权)人: | 天津光电安辰信息技术股份有限公司 |
主分类号: | H04M9/08 | 分类号: | H04M9/08;G10L21/003;G10L19/16 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 李林娟 |
地址: | 300211*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 通信 系统 音质 优化 装置 | ||
技术领域
本发明涉及音通信系统领域,尤其涉及一种用于语音通信系统的音质优化装置。
背景技术
现代通信系统提供了广泛的语音服务,语音通信已经成为生活中不可或缺的交流方式。
然而,经过编解码后的语音质量受到很多条件的制约,例如:编码器速率的高低、环境噪声的情况、传输信道误码的影响、多重编解码的影响、不同发音者(如高音和低音)的影响、不同语言的影响等。
因此,如何提高语音通信系统的音质,并能在主观意义上音质不降低的前提下尽可能减轻网络负担成为了非常重要的研究课题。
发明内容
本发明提供了一种用于语音通信系统的音质优化装置,本发明通过在通话过程中加入多种技术,实现了既能清晰地通话交流,又能降低网络负担,详见下文描述:
一种用于语音通信系统的音质优化装置,所述音质优化装置包括:
系统控制模块调用回声抑制模块与音频流接收模块进行通信;系统控制模块调用静音检测模块与音频流接收模块进行通信;系统控制模块调用舒适噪音模块与音频流输出模块进行通信;系统控制模块调用网络抖动处理模块与音频流输出模块进行通信;
其中,所述回声抑制模块的工作流程如下:
根据系统种类和版本,获取配置文件,确定回声消除的方式;在通话过程中,将收发的语音流缓存到数据空间中;
将最新的收发包与缓存中的内容对比,从中筛选并且过滤出回音的部分,然后计算出抵消的频率,达到消除回音的效果;接收释放的缓存数据。
其中,所述回声抑制模块包括:音频流优化子模块,
所述音频流优化子模块将采集的音频数据依次分区缓存;获取存满一个区域后的音频数据,根据音频数据的音频增益均值以及音频阈值确定头部控制信息,并将头部控制信息填充到音频数据中;
根据头部控制信息确定音频种类,根据音频种类确定压缩比,进而根据压缩比对音频数据进行编码;
依据实时传输协议RTP将编码后的音频数据封装成RTP流,并将RTP流发送到网络中,依据实时传输控制协议RTCP发送RTCP控制流到网络中,在网络中进行RTCP检测并获取网络的数据包丢包率和数据包丢弃率,根据数据包丢包率和数据包丢弃率获取网络性能参数;
根据网络性能参数以及音频增益均值对音频阈值进行更新,以调整下一区域音频数据的压缩比。
其中,所述根据音频数据的音频增益均值以及音频阈值确定头部控制信息具体为:
当音频数据的音频增益均值小于音频阈值时,将头部控制信息设置为0,表示音频数据送入编码器后,通过高压缩低保真算法编码;
当音频数据的音频增益均值不小于音频阈值,将头部控制信息设置为I,表示音频数据送入编码器后,通过低压缩高保真算法编码。
进一步地,所述静音检测模块包括:
第一语音活动性检测子模块将说话者处于不发声状态的信息写入发送音频流缓存,交由第二发送音频流缓存子模块处理;
第二发送音频流缓存子模块向下一步骤处理者发送所有缓存数据;第二接收音频流缓存子模块和第二发送音频流缓存子模块分别释放各自缓存数据。
进一步地,所述舒适噪音子模块包括:
第二语音活动性检测子模块从第三接收音频流缓存子模块中读取数据,用于快速检测出说话者处于不发声的时间,并利用舒适噪音生成子模块产生的人工噪音填充该段时间内的语音数据流,并将上述处理结果存入发送音频流缓存;
舒适噪音生成子模块结合差值算法动态生成背景噪音,并将该背景噪音的语音数据流提供给第二语音活动性检测子模块;
第三接收音频流缓存子模块和第三发送音频流缓存子模块分别释放各自缓存数据。
其中,所述第二语音活动性检测子模块还用于调用舒适噪音配置文件存取模块,获取配置文件,确定舒适噪音生成的方式;
在通话过程中,通过声音采集分别将收发的语音流缓存到第三接收音频流缓存子模块和第三发送音频流缓存子模块的数据空间中。
其中,所述网络抖动处理模块包括:入队线程数据包处理子模块、出队线程数据包处理子模块,
入队线程数据包处理子模块对接收到的数据包进行排序后,将接收到的数据包插入抖动缓存指针队列的相应位置;
出队线程数据包处理子模块判断抖动缓存指针队列队头的数据包是否应该在当前触发时刻出队,如果是,则将该数据包出队。
本发明提供的技术方案的有益效果是:
1、本发明通过在数据传输过程中加入多种音频处理技术,避免了可能存在的语音通信过程中的啸叫、传输成本过高以及网络压力过大引起的延迟等问题;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津光电安辰信息技术股份有限公司,未经天津光电安辰信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711152325.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的供水检测装置
- 下一篇:开极速度调节机构及开关装置