[发明专利]上下文感知语音可懂度增强在审
申请号: | 202080063374.1 | 申请日: | 2020-09-09 |
公开(公告)号: | CN114402388A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | D·诺;P·丘巴列夫;郭晓雨 | 申请(专利权)人: | DTS公司 |
主分类号: | G10L21/0364 | 分类号: | G10L21/0364;G10L25/18;H03G3/32 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘前红 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 上下文 感知 语音 可懂度 增强 | ||
1.一种方法,包括:
用麦克风检测环境中的噪声以产生噪声信号;
接收要通过扬声器播放到所述环境中的语音信号;
基于所述麦克风的麦克风传递函数和所述扬声器的扬声器传递函数之间的关系,确定用于多频带语音可懂度计算的频率分析区域;和
基于所述噪声信号和所述语音信号,在所述频率分析区域上计算多频带语音可懂度结果。
2.如权利要求1所述的方法,还包括:
使用所述多频带语音可懂度结果增强所述语音信号的可懂度。
3.如权利要求1所述的方法,其中:
所述确定包括将所述麦克风传递函数的麦克风通带和所述扬声器传递函数的扬声器通带相重叠的重叠通带确定为所述频率分析区域;并且
所述计算包括在限于所述重叠通带的语音分析带上计算每频带语音可懂度值。
4.如权利要求3所述的方法,其中,所述计算还包括计算(i)在限于所述重叠通带的语音分析带上基于所述语音信号的语音功率与(ii)在所述麦克风通带上基于所述噪声信号的噪声功率的全局语音噪声比。
5.如权利要求3所述的方法,还包括:
确定所述扬声器通带的起始频率是否大于所述麦克风通带的起始频率;以及
当所述扬声器通带的起始频率更大时,在低于所述麦克风通带的起始频率的频带内衰减所述语音信号。
6.如权利要求3所述的方法,其中,所述确定包括:
识别分别定义所述麦克风通带和所述扬声器通带的起始频率和停止频率;以及
将所述重叠通带计算为从最大起始频率延伸到最小停止频率的通带。
7.如权利要求1所述的方法,其中:
所述计算多频带语音可懂度结果包括计算每频带语音可懂度值和全局语音噪声比。
8.如权利要求1所述的方法,其中,所述计算多频带语音可懂度结果包括:
基于所述语音信号和所述噪声信号的短/中长度片段执行多频带语音可懂度分析,以产生短期语音可懂度结果;以及
基于所述语音信号和所述噪声信号的比所述短/中长度片段长的长片段执行多频带语音可懂度分析,以产生长期语音可懂度结果。
9.如权利要求1所述的方法,还包括:
基于所述麦克风传递函数执行所述噪声信号的多频带校正,以产生校正后的噪声信号;以及
基于所述扬声器传递函数执行所述语音信号的多频带校正,以产生校正后的语音信号,
其中所述计算包括基于所述校正后的噪声信号和所述校正后的语音信号,在所述频率分析区域上计算所述多频带语音可懂度结果。
10.如权利要求9所述的方法,还包括:
在执行所述噪声信号的多频带校正之前,基于所述麦克风的灵敏度执行所述噪声信号的数字到声学等级转换;以及
在执行所述语音信号的多频带校正之前,基于所述扬声器的灵敏度执行所述语音信号的数字到声学等级转换。
11.一种装置,包括:
麦克风,用于检测环境中的噪声以产生噪声信号;
扬声器,用于将语音信号播放到所述环境中;以及
控制器,耦合到所述麦克风和所述扬声器,并且被配置为执行:
基于所述麦克风的麦克风传递函数对所述噪声信号的多频带校正,以产生校正后的噪声信号;
基于所述扬声器的扬声器传递函数对所述语音信号的多频带校正,以产生校正后的语音信号;
基于所述校正后的噪声信号和所述校正后的语音信号计算多频带语音可懂度结果;
基于所述多频带语音可懂度结果计算多频带增益值;以及
基于所述多频带增益值增强所述语音信号。
12.如权利要求11所述的装置,其中,所述控制器还被配置为执行:
使用所述多频带语音可懂度结果增强所述语音信号的可懂度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于DTS公司,未经DTS公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080063374.1/1.html,转载请声明来源钻瓜专利网。