[发明专利]一种语音质量评估方法及装置有效
申请号: | 201711462465.9 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109979486B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 梁立涛;王刚;侯普 | 申请(专利权)人: | 中国移动通信集团北京有限公司;中国移动通信集团公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/03;G10L25/12;G10L25/24 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100007 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 质量 评估 方法 装置 | ||
1.一种语音质量评估方法,其特征在于,包括:
对待评估信号进行声道建模,得到所述待评估信号的第一特征标识,所述第一特征标识用于指示所述待评估信号的声道特征;
对所述待评估信号进行话音重建,得到重建后的恢复信号,通过比较所述待评估信号和所述恢复信号的差异,得到所述待评估信号的第二特征标识;
提取所述待评估信号中的失真标识,作为所述待评估信号的第三特征标识;其中,所述待评估信号的特征标识集包含所述第一特征标识、所述第二特征标识和所述第三特征标识,所述特征标识集用于指示所述待评估信号的特征;
对所述特征标识集进行整合重建,得到强特征标识集;
将所述强特征标识集输入感知映射模型,确定所述待评估信号的质量评估值,所述感知映射模型用于指示所述待评估信号的特征与质量评估值的映射关系。
2.如权利要求1所述的方法,其特征在于,所述第一特征标识包括发音腔系数、线性预测系数和倒谱系数;
所述第二特征标识包含话音基本质量、加性噪声和乘性噪声;
所述第三特征标识包含语音中断时长、静音时长和电平骤降。
3.如权利要求1或2所述的方法,其特征在于,将所述特征标识集进行整合重建,得到强特征标识集,具体包括:
对所述特征标识集进行归一化处理;
对经过所述归一化处理的所述特征标识集进行标识冗余校验;
对经过所述标识冗余校验的所述特征标识集进行重组,得到所述强特征标识集,所述强特征标识集符合所述感知映射模型的输入需求。
4.如权利要求3所述的方法,其特征在于,针对所述特征标识集中的任一特征标识x,采用如下公式对所述特征标识集进行归一化处理:
其中,x'为x经过所述归一化处理后得到的特征标识,是所有样本中与x属于同一类型的特征标识的数值的平均值,S为所有样本中与x属于同一类型的特征标识的数值的标准差。
5.如权利要求4所述的方法,其特征在于,对经过所述归一化处理的所述特征标识集进行标识冗余校验,具体包括:
对经过所述归一化处理的所述特征标识集中包含的多个特征标识分别进行互信息校验,得到所述多个特征标识分别对应的互信息值;
选取所述多个特征标识中互信息值大于预设值的至少一个特征标识;或者,选择所述多个特征标识中互信息值按照从大到小的顺序排列在前N个的N个特征标识,N≥1。
6.如权利要求1或2所述的方法,其特征在于,将所述强特征标识集输入所述感知映射模型,确定所述待评估信号的质量评估值,具体包括:
将所述强特征标识集输入所述感知映射模型,所述感知映射模型包含多个决策树以及与所述多个决策树一一对应的多个权重值;
分别根据所述多个决策树和所述强特征标识得到多个评估结果;
分别将所述多个评估结果与对应的所多个权重值进行加权求和运算,确定所述待评估信号的质量评估值。
7.如权利要求6所述的方法,其特征在于,在分别根据所述多个决策树和所述强特征标识得到多个评估结果之前,还包括:
针对所述多个决策树中的任一决策树,通过如下步骤对所述决策树进行模型训练:
设定损失函数为其中,yi是训练样本中语音信号的平均主观意见得分MOS值,xi是所述决策树的预测输入值,a和b为所述决策树的待训练参数,a+b·xi为根据所述决策树和所述预测输入值得到的所述语音信号的质量评估值;
根据所述损失函数对待训练参数进行训练,将本次训练得到的待训练参数作为下一次模型训练的输入,从而修正待训练参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团北京有限公司;中国移动通信集团公司,未经中国移动通信集团北京有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711462465.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频评价方法和装置
- 下一篇:语音信号检测方法和装置