[发明专利]基于线性预测残差负熵的语音音质度量评价方法及装置有效
申请号: | 202010659644.7 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111540382B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 李科;张卫强;黄宇凯;郝玉峰;宋琼;廖晓玲 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司;清华大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/21;G10L25/12 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线性 预测 残差负熵 语音 音质 度量 评价 方法 装置 | ||
1.一种基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述方法包括:
获取待评价的语音数据;
将所述语音数据划分为多个语音帧;
对所述语音帧进行线性预测分析,得到线性预测残差;
计算每个所述语音帧的线性预测残差负熵;
根据所述负熵评价所述语音数据的音质;
其中,所述根据所述负熵评价所述语音数据的音质包括:
根据每个所述语音帧的负熵,计算所述语音数据的负熵;
对所述语音数据的负熵进行归一化;
根据所述归一化的语音数据的负熵,评价所述语音数据的音质。
2.根据权利要求1所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述将所述语音数据划分为多个语音帧包括:
检测所述语音数据,得到有效语音;
根据时长划分所述有效语音为多个语音帧;
计算所述语音帧的能量值,保留高能量语音帧。
3.根据权利要求2所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述检测所述语音数据,得到有效语音包括:
对所述语音数据进行活动检测,标记静音区间;
将所述静音区间删除,保留所述有效语音。
4.根据权利要求2所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述计算所述语音帧的能量值,保留高能量语音帧包括:
计算所述语音帧的能量值;
基于所述能量值对全部所述语音帧排序;
根据排序结果,保留能量值最大的N个语音帧。
5.根据权利要求4所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述N个语音帧占全部语音帧的80%。
6.根据权利要求1所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述对所述语音帧进行线性预测分析,得到线性预测残差包括:
构建线性预测分析模型,对所述语音帧进行预测;
根据所述线性预测分析模型,计算线性预测系数,得到所述语音帧的线性预测残差。
7.根据权利要求6所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述构建线性预测分析模型,对所述语音帧进行预测包括:
所述语音帧的语音信号为,所述线性预测分析模型当前采样值由前
其中为线性预测系数,为线性预测残差。
8.根据权利要求1所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述计算每个所述语音帧的线性预测残差负熵包括:
对所述残差进行均值化处理,获取所述残差均值的中心统计量;
根据所述中心统计量,计算所述语音帧的负熵。
9.根据权利要求8所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述对所述残差进行均值化处理,包括:
对所述残差进行零均值化,即
其中,为残差信号的均值;
所述获取所述残差均值的中心统计量包括:
计算所述零均值化后的残差的二三四阶中心统计量:
根据所述中心统计量,计算所述语音帧的负熵:
。
10.根据权利要求1所述的基于线性预测残差负熵的语音音质度量评价方法,其特征在于,所述根据每个所述语音帧的负熵,计算所述语音数据的负熵包括:
根据每个所述语音帧的负熵,计算所有所述语音帧的负熵中值,得到所述语音数据的负熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司;清华大学,未经北京海天瑞声科技股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010659644.7/1.html,转载请声明来源钻瓜专利网。