[发明专利]基于线性预测残差负熵的语音音质度量评价方法及装置有效
申请号: | 202010659644.7 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111540382B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 李科;张卫强;黄宇凯;郝玉峰;宋琼;廖晓玲 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司;清华大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/21;G10L25/12 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线性 预测 残差负熵 语音 音质 度量 评价 方法 装置 | ||
本公开是关于一种基于线性预测残差负熵的语音音质度量评价方法及装置、电子设备和计算机可读存储介质。其中方法包括:获取待评价的语音数据;将语音数据划分为多个语音帧;对语音帧进行线性预测分析,得到线性预测残差;计算每个语音帧的线性预测残差负熵;根据负熵评价语音数据的音质。通过利用语音信号的线性预测残差的负熵,可以实现定量的对语音音质的高层特征进行评价,而评价结果也更加接近于主观判断,从而对语音数据库的生产提供质量控制依据。
技术领域
本公开涉及语音信号处理领域,尤其涉及一种基于线性预测残差负熵的语音音质度量评价方法及装置、电子设备和计算机可读存储介质。
背景技术
语音作为信息传递的重要载体,与其相关构成的通信、编码、存储和处理等语音系统已成为现代社会信息交流的必要手段,且已广泛应用于社会各个领域。语音音质是语音的重要附属性质,在构建语音识别、语音合成等数据库时是一项重要的考量指标。
语音音质评价从评价主体上讲可分为两类:主观评价和客观评价。主观评价是依靠评听者意见对音质做出判断。目前国内外采用较多的主观评价方法有:平均意见分MOS(Mean Opinion Score)、失真平均意见分DMOS(Degradation Mean Opinion Score)、诊断韵字测试DRT(Diagnostic Rhyme Test)、诊断满意度测量DAM(Diagnostic AcceptabilityMeasure)等。它们的缺点是费时费力,重复性差,难以组织实施不够灵活,而且条件不具备时无法组织实施,容易受人的主观因素影响,不利于在生产过程和现场实验中应用等。
针对主观评价方法的不足,许多学者陆续提出了基于客观测度的客观音质评价方法,依靠计算设备实现自动化的评价方法,在语音数据库、语音设备的开发、研制、生产中都有广泛的应用前景。为了达到评价语音音质的目的,开发有效的语音音质评价方法是不可或缺的。
发明内容
为克服相关技术中存在的问题,本公开提供一种基于线性预测残差负熵的语音音质度量评价方法及装置、电子设备和计算机可读存储介质。
根据本公开实施例的第一方面,提供一种基于线性预测残差负熵的语音音质度量评价方法,方法包括:获取待评价的语音数据;将所述语音数据划分为多个语音帧;对所述语音帧进行线性预测分析,得到线性预测残差;计算每个所述语音帧的线性预测残差负熵;根据所述负熵评价所述语音数据的音质。
在一实施例中,所述将所述语音数据划分为多个语音帧包括:检测所述语音数据,得到有效语音;根据时长划分所述有效语音为多个语音帧;计算所述语音帧的能量值,保留高能量语音帧。
在一实施例中,所述检测所述语音数据,得到有效语音包括:对所述语音数据进行活动检测,标记静音区间;将所述静音区间删除,保留所述有效语音。
在一实施例中,所述计算所述语音帧的能量值,保留高能量语音帧包括:计算所述语音帧的能量值;基于所述能量值对全部所述语音帧排序;根据排序结果,保留能量值最大的N个语音帧。
在一实施例中,所述N个语音帧占全部语音帧的80%。
在一实施例中,所述对所述语音帧进行线性预测分析,得到线性预测残差包括:构建线性预测分析模型,对所述语音帧进行预测;根据所述线性预测分析模型,计算线性预测系数,得到所述语音帧的线性预测残差。
在一实施例中,所述构建线性预测分析模型,对所述语音帧进行预测包括:所述语音帧的语音信号为,所述线性预测分析模型当前采样值由前
其中为线性预测系数,为线性预测残差。
在一实施例中,所述计算每个所述语音帧的线性预测残差负熵包括:对所述残差进行均值化处理,获取所述残差均值的中心统计量;根据所述中心统计量,计算所述语音帧的负熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司;清华大学,未经北京海天瑞声科技股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010659644.7/2.html,转载请声明来源钻瓜专利网。