[发明专利]语音质量评估方法、装置、设备及介质在审
申请号: | 201811614199.1 | 申请日: | 2018-12-27 |
公开(公告)号: | CN111383657A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | 马越 | 申请(专利权)人: | 中国移动通信集团辽宁有限公司;中国移动通信集团有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/24;G10L25/30;G10L25/60 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 评估 方法 装置 设备 介质 | ||
1.一种语音质量评估方法,包括:
采集原始语音样本;
基于所述原始语音样本,获得实时传输协议RTP流媒体包;
从所述RTP流媒体包中获得退化语音样本;
从所述退化语音样本中筛选有效语音样本;
提取所述有效语音样本中与平均意见得分MOS具有强相关性的多个声学特征;
基于所述与MOS具有强相关性的多个声学特征,构建基于多个声学特征的MOS评估模型;
将待评估语音质量的样本输入所述基于多个声学特征的MOS评估模型中,输出所述待评估语音质量的样本的MOS评分。
2.根据权利要求1所述的方法,其特征在于,所述采集原始语音样本,包括:
在多个场景下,利用人工进行多次拨测,采集原始语音样本;其中,
所述多个场景包括如下项中的至少一项商场、写字楼、学校、景区、道路、交通枢纽、以及居民区。
3.根据权利要求1所述的方法,其特征在于,
所述原始语音样本包括主叫侧语音样本;
所述退化语音样本包括网络平台侧语音样本和/或被叫侧语音样本。
4.根据权利要求1所述的方法,其特征在于,所述基于所述原始语音样本,获得实时传输协议RTP流媒体包,从所述RTP流媒体包中获得退化语音样本,包括:
基于所述原始语音样本,通过Mb接口采集RTP流媒体包;
对所述RTP流媒体包进行抽样处理,得到抽样语音片段;
对所述抽样语音片段进行还原处理,获取退化语音样本;
其中,所述抽样处理包括将所述RTP流媒体包分割为具有预设周期的抽样语音片段。
5.根据权利要求4所述的方法,其特征在于,所述对所述抽样语音片段进行还原处理,包括:
利用基于模型的恢复法,对所述抽样语音片段进行还原处理。
6.根据权利要求1所述的方法,其特征在于,
所述多个声学特征中的每一个均包括时域特征参数和频域特征参数;其中,
所述时域特征参数包括如下项中的至少一项:短时能量、短时平均幅度、短时过零率、和短时自相关函数;所述频域特征参数包括如下项中的至少一项:梅尔倒谱系数MFCC、感知线性预测PLP、共振峰、基音、和反射系数。
7.根据权利要求1所述的方法,其特征在于,所述提取所述有效语音样本中与平均意见得分MOS具有强相关性的多个声学特征,包括:
粗略提取所述有效语音片段中与MOS具有强相关性的声学特征;
从粗略提取得到的声学特征中精细提取与MOS具有强相关性的多个声学特征。
8.根据权利要求7所述的方法,其特征在于,所述粗略提取所述有效语音片段中与MOS具有强相关性的声学特征,包括:
利用散点图法,粗略提取所述有效语音片段中与MOS具有强相关性的声学特征。
9.根据权利要求7所述的方法,其特征在于,所述从粗略提取得到的声学特征中精细提取与MOS具有强相关性的多个声学特征,包括:
利用主成分分析算法,从粗略提取得到的声学特征中精细提取与MOS具有强相关性的声学特征。
10.根据权利要求1所述的方法,其特征在于,所述基于所述与MOS具有强相关性的多个声学特征,构建基于多个声学特征的MOS评估模型,包括:
基于所述与MOS具有强相关性的多个声学特征,利用基于深度神经网络算法大数据分析,拟合训练出所述多个声学特征与MOS之间的对应关系,以构建所述基于多个声学特征的MOS评估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团辽宁有限公司;中国移动通信集团有限公司,未经中国移动通信集团辽宁有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811614199.1/1.html,转载请声明来源钻瓜专利网。