[发明专利]语音增强质量评估方法、装置、终端及存储介质在审
申请号: | 202011376869.8 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112530460A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 方泽煌;康元勋 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L21/0208;G10L21/02 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红;吴落 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 质量 评估 方法 装置 终端 存储 介质 | ||
本发明公开了一种语音增强质量评估方法、装置、终端及存储介质,利用干净语音信号作为原始信号,在进行语音增强之前叠加不同类型的噪声生成带噪语音信号,接着通过语音增强算法处理生成语音增强信号,最后将干净的原始语音信号和语音增强信号导入PESQ中得到语音增强质量评估分数,该方法可以任意地模拟不同场景的带噪语音信号,实现在大规模的场景测试中更加灵活方便地进行语音增强质量评估。
技术领域
本发明涉及语音通信技术领域,特别涉及一种语音增强质量评估方法、装置、终端及存储介质。
背景技术
随着会议通信和VoIP通信的发展,用户对于会议终端的语音信号质量的要求越来越高,因此,在会议终端配有语音增强相关技术已成为现有标配。
为了测试语音增强后的语音质量,现有技术中公开了一种终端语音质量评估方法和终端,其中,所述方法包括:终端根据待评估的语音质量类型获取源标准音源信号;终端根据待评估的语音质量类型对该源标准音源信号进行处理;终端将源标准音源信号以及经过处理的源标准音源信号导入PESQ算法,通过该算法对语音质量进行评估;语音质量类型包括:终端上行语音质量、终端下行语音质量以及终端语音通道的语音质量。本发明实现了终端独立、简便地评估终端语音质量。
但是本发明人发现上述现有技术存在以下不足:由于每次测试都需要使用指定的标准音源信号,导致该方法步骤繁琐,造成在大规模的场景测试中适用的不便。
发明内容
本发明的目的在于提供一种语音增强质量评估方法、装置、终端及存储介质,利用干净语音信号作为原始信号,在进行语音增强之前叠加不同类型的噪声生成带噪语音信号,接着通过语音增强算法处理生成语音增强信号,最后将干净的原始语音信号和语音增强信号导入PESQ中得到语音增强质量评估分数,该方法可以任意地模拟不同场景的带噪语音信号,实现在大规模的场景测试中更加灵活方便地进行语音增强质量评估。
第一方面,本发明实施例提供一种语音增强质量评估方法,所述方法包括以下步骤:
获取数据的步骤:获取干净语音信号和噪声数据;
生成带噪语音信号的步骤:根据预设的评估内容对所述干净语音信号和所述噪声数据进行处理以生成带噪语音信号;其中,所述评估内容包括噪声数据的产生场景和带噪语音信号的信噪比;
生成语音增强信号的步骤:利用语音增强算法对所述带噪语音信号进行处理以生成语音增强信号;
评估语音增强质量的步骤:将所述干净语音信号和所述语音增强信号导入到PESQ中计算得到语音增强质量评分。
作为本发明第一方面的进一步改进,所述生成带噪语音信号的步骤,具体包括以下步骤:
选取多条所述噪声数据进行叠加以生成噪声信号;
根据带噪语音信号的信噪比计算对应的噪声信号的缩放系数;
根据缩放系数对噪声信号进行缩放处理,并将缩放处理后的噪声信号与干净语音信号叠加以生成带噪语音信号。
作为本发明第一方面的进一步改进,所述缩放系数的计算公式如下:
其中,αnoise表示噪声信号的缩放系数,snr表示带噪语音信号的信噪比。
作为本发明第一方面的进一步改进,所述生成带噪语音信号的计算公式如下:
noisy(x)=speech(x)+αnoise*noise(x)
其中,noisy(x)表示带噪语音信号,speech(x)表示干净语音信号,noise(x)表示噪声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011376869.8/2.html,转载请声明来源钻瓜专利网。