[发明专利]语音质量评估方法、系统、计算机可读存储介质有效
申请号: | 202110950617.X | 申请日: | 2021-08-18 |
公开(公告)号: | CN113689883B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 高旭博 | 申请(专利权)人: | 杭州雄迈集成电路技术股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/51 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 杨琪宇 |
地址: | 311400 浙江省杭州市富阳*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 评估 方法 系统 计算机 可读 存储 介质 | ||
本发明公开一种语音质量评估方法、系统、计算机可读存储介质,其中方法包括以下步骤:获取相对应的降噪信号和参考信号,所述降噪信号包括若干降噪信号帧,所述参考信号包括若干参考信号帧;基于参考信号帧,计算各降噪信号帧的语音清晰度,获得相应的帧清晰度;基于声音分贝值对各参考信号帧进行分组,并基于分组结果对各降噪信号帧进行分组,获得若干个降噪信号帧集;基于降噪信号帧集中各降噪信号帧的帧清晰度,计算各降噪信号帧集所对应的语音清晰度,获得相应的段清晰度;对各段清晰度进行加权计算,获得所述降噪信号的语音清晰度。本发明基于段清晰度进行加权计算,使所得语音清晰度更贴合实际人类感知。
技术领域
本发明涉及声学计算领域,尤其涉及一种用于对降噪质量进行评估的语音质量评估技术。
背景技术
对于增强之后的语音质量评估通常分为两种方式:主观评估测度和客观质量评估测度。
主观评估方法主要是对增强之后的语音进行人为试听并进行打分,如使用最广泛的平均意见得分(MOS)方法、相对偏好方法(也称之为等偏好测试)等;主观评估测度一般被认为是最可靠的语音质量评估方法,然而由于需要大量的专业人员进行反复试听并进行综合打分,耗时长,评估效率低。
发明内容
本发明针对现有主观评估方法进行语音质量评估,耗时长,评估效率低,人力成本大等缺点,提出了一种能够客观、准确评价降噪语音质量的评估技术。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种语音质量评估方法,用于在音频增强过程中,对音频的降噪质量进行评估,包括以下步骤:
获取降噪信号和与所述降噪信号相对应的参考信号,所述降噪信号包括若干降噪信号帧,所述参考信号包括与所述降噪信号帧一一对应的参考信号帧;
基于参考信号帧,计算各降噪信号帧的语音清晰度,获得相应的帧清晰度;
基于声音分贝值对各参考信号帧进行分组,并基于分组结果对各降噪信号帧进行分组,获得若干个降噪信号帧集;
基于降噪信号帧集中各降噪信号帧的帧清晰度,计算各降噪信号帧集所对应的语音清晰度,获得相应的段清晰度,如对降噪信号帧集所对应的帧清晰度进行求平均,将所得平均值作为段清晰度;
对各段清晰度进行加权计算,获得所述降噪信号的语音清晰度,加权计算时所采用的清晰度权重可为固定权重或自适应权重。
作为一种可实施方式:
计算参考信号和降噪信号之间的幅度平方相干度;
计算所述降噪信号的能量谱密度数据;
获取预设的听觉滤波器,所述听觉滤波器设有若干个临界频带;
基于所述幅度平方相干度、所述能量谱密度数据和所述听觉滤波器计算降噪信号帧在各临界频带上的信噪比失真率;
基于所述信噪比失真率计算各降噪信号帧的语音清晰度,获得相应的帧清晰度。
作为一种可实施方式,计算所述信噪比失真率的公式为:
其中,SDR表示M个降噪信号帧分别在J个临界频带上的信噪比失真率,M表示降噪信号帧的总帧数,Wj表示听觉滤波器,|γ|2表示幅度平方相干度,Syy(k)表示能量谱密度数据,K表示频点的总数,k表示频点下标。
作为一种可实施方式,计算所述幅度平方相干度|γ|2的公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州雄迈集成电路技术股份有限公司,未经杭州雄迈集成电路技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110950617.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于氮氧传感器的氧化铝浆料及其制备方法
- 下一篇:滤波电容器降噪装置