[发明专利]用于评估退化语音信号的可理解性的方法和装置在审
申请号: | 201380069674.0 | 申请日: | 2013-11-15 |
公开(公告)号: | CN104919525A | 公开(公告)日: | 2015-09-16 |
发明(设计)人: | 约翰·杰勒德·贝伦茨 | 申请(专利权)人: | 荷兰应用自然科学研究组织TNO |
主分类号: | G10L25/69 | 分类号: | G10L25/69;G10L25/21 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 康泉;宋志强 |
地址: | 荷兰*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 评估 退化 语音 信号 可理解 方法 装置 | ||
技术领域
本发明涉及通过将参考语音信号传送通过音频传输系统来提供退化语音信号,评估从音频传输系统接收的退化语音信号的可理解性的方法,其中该方法包括:将所述参考语音信号采样成多个参考信号帧,并且针对每个帧,确定参考信号表现;将所述退化语音信号采样成多个退化信号帧,并且针对每个帧,确定退化信号表现;通过将每个参考信号帧与对应的退化信号帧相关联,形成帧对,并且针对每个帧对,提供表示所述退化信号帧和关联的所述参考信号帧之间的差的差分函数。
本发明还涉及一种用于执行上面描述的方法的装置和一种计算机程序产品。
背景技术
在过去数十年间,已经使用感知测量方法开发和展开多种客观的语音质量测量方法。在该方法中,基于感知的算法模拟在听音测试中对音频片段的质量进行定级的对象的行为。对于语音质量,最可能使用所谓的绝对种类定级听音测试,在该测试中对象在不访问纯净的参考语音片段的情况下判断退化语音片段的质量。在国际电信联盟(ITU)内执行的听音测试主要使用绝对种类定级(ACR)5点意见等级,其因此还被用于由ITU标准化的客观语音质量测量方法,感知语音质量测量(PSQM(ITU-T Rec.P.861,1996))以及其随后的语音质量的感知评估(PESQ(ITU-T Rec.P.862,2000))。这些测量标准的焦点在于窄带语音质量(音频带宽10-3500Hz),尽管在2005年构想出宽带扩展(50-7000Hz)。PESQ提供与窄带语音数据的主观听音测试十分好的相关性以及对宽带数据可接受的相关性。
随着电信业推出新的宽带语音服务,出现了对经验证的性能的高级测量标准以及支持较高的音频带宽的需求。因此,ITU-T(ITU-电信部)12研究组发起了新的语音质量评价算法的标准化作为PESQ的技术更新。新的第三代测量标准POLQA(感知客观听音质量评价)克服了PESQ P.862标准的不足,如线性频率响应失真、在IP电话中发现的时间伸展/压缩、特定类型的编解码失真以及回声的影响的错误的评价。
尽管POLQA(P.863)提供相对于之前的质量评估算法PSQM(P.861)和PESQ(P.862)的诸多改进,但是目前的POLQA版本(如PSQM和PESQ)不能解决基本的主观感知质量情况,即可理解性。尽管可理解性还依赖于诸多音频质量参数,但是可理解性比声音质量与信息传递更加相关。就这些质量评价算法而言,可理解性与声音质量截然相反的本质使得这些算法产生与在由人或听众评估语音信号时会被分配的分数不匹配的评估分数。将焦点保持在信息共享的目标,人们会认为在声音质量上相似的可理解的语音信号比不太好理解的信号更重要。
尽管取得了许多进展,但是在诸多情况下当前模型仍意料之外地不能正确地预测人可理解性的评估分数。
发明内容
本发明的目的是寻求一种上述现有技术不足的解决方案以及提供一种评估(退化)语音信号的质量评估算法,该质量评估算法适合于考虑语音信号的可理解性以便以最接近于人评估的方式评估该语音信号。
本发明实现这个目的和其它目的,因为提供一种通过将参考语音信号传送通过所述音频传输系统以提供退化语音信号,评估从所述音频传输系统接收的退化语音信号的可理解性的方法。参考语音信号至少表示(表达)由辅音和元音的组合组成的一个或多个词。参考语音信号被采样成多个参考信号帧,并且退化语音信号被采样成多个退化信号帧。通过将参考信号帧和退化信号帧彼此关联,形成帧对。根据该方法,向每个帧对提供表示所述退化信号帧和关联的所述参考信号帧之间的差的差分函数。针对一个或多个干扰类型补偿差分函数,以向每个帧对提供适合于人听觉感知模型的干扰密度函数。根据多个帧对的干扰密度函数,导出总体质量参数。总体质量参数至少指示所述退化语音信号的可理解性。特别地,所述方法还包括:针对由参考语音信号表达的词中的至少一个词,识别与至少一个词的至少一个辅音关联的参考信号部分和退化信号部分。根据所识别的参考信号部分和退化信号部分,基于退化信号部分的信号功率与参考信号部分的信号功率的比较,确定退化语音信号的干扰的程度。然后,依据所确定的与至少一个辅音关联的退化语音信号的干扰的程度,补偿总体质量参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荷兰应用自然科学研究组织TNO,未经荷兰应用自然科学研究组织TNO许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380069674.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于核部件的带屏蔽迁移的方法和装置
- 下一篇:显示装置