[发明专利]一种语音晚期混响抑制方法及系统在审
申请号: | 202010016846.X | 申请日: | 2020-01-08 |
公开(公告)号: | CN111179958A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 方泽煌;康元勋 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
代理公司: | 安徽知问律师事务所 34134 | 代理人: | 郭大美 |
地址: | 361009 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 晚期 混响 抑制 方法 系统 | ||
1.一种语音晚期混响抑制方法,其特征在于:包括
采集室内的混响语音信号,提取混响衰减参数;
根据混响衰减参数计算混响频谱特征a;
根据混响频谱特征a及朴素谱减法计算混响抑制后的语音频谱特征b;
对语音频谱特征b进行插值计算,利用混响语音信号的相位特征对语音频谱特征b进行还原得到波形语音,并输出该波形语音。
2.根据权利要求1所述的一种语音晚期混响抑制方法,其特征在于:提取混响衰减参数的具体过程包括:
对混响语音信号进行加窗分帧处理并进行短时傅里叶变换;
计算每帧的幅度谱并将幅度谱均匀分为H个频带;
计算每个频带的均值和最大值得到H维子频带特征和H个最大值;
利用H个最大值对H维子频带特征进行归一化处理得到H个混响衰减参数。
3.根据权利要求1所述的一种语音晚期混响抑制方法,其特征在于:通过以下公式计算混响频谱特征a:
(0j≤c且d+c≤i)或(j+d-1id+c),i,j∈N+
其中表示当前帧估计的混响频谱特征a,X表示输入信号频谱特征,i表示当前混响频谱特征帧索引,j表示混响衰减参数帧索引,c表示声源发出声音到到达麦克风的时间,d表示混响衰减参数的长度。
4.根据权利要求1所述的一种语音晚期混响抑制方法,其特征在于:利用线性插值方法对语音频谱特征b进行插值。
5.根据权利要求2所述的语音晚期混响抑制方法,其特征在于:通过下列公式进行归一化处理:
D=Xsubband/M
其中D表示归一化后的衰减参数,Xsubband表示H维子频带特征,M表示H维子频带对应的最大值。
6.根据权利要求3所述的一种语音晚期混响抑制方法,其特征在于:利用以下公式计算混响抑制后的语音频谱特征b:
其中表示混响抑制后的语音频谱特征b。
7.根据权利要求4所述的一种语音晚期混响抑制方法,其特征在于:对语音频谱特征b的H维子频带特征进行插值得到若干个频点,利用以下公式对语音频谱特征b进行插值:
beginfend
其中,f表示表示频点编号,begin表示当前子频带的第一个频点,end表示当前子频带的最后一个频点,y表示各频点的数值。
8.根据权利要求1~7任一项所述的语音晚期混响抑制方法,其特征在于:利用混响语音信号的相位特征进行逆傅里叶变换将语音频谱特征b还原得到波形语音。
9.一种语音晚期混响抑制系统,其特征在于:包括采集单元、计算单元、传输单元和终端,采集单元与计算单元电连接,计算单元和终端分别与传输单元连接,其中,所述计算单元包括存储器和处理器,存储器与处理器连接,且存储器内存储有程序,该程序用于实现权利要求1~8任一项所述的一种语音晚期混响抑制方法,处理器用于执行程序输出波形语音。
10.根据权利要求9所述的一种生成混合语音数据的系统,其特征在于,采集单元包括声音采集器和信号转换器,声音采集器与信号转换器电连接,信号转换器与计算单元电连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010016846.X/1.html,转载请声明来源钻瓜专利网。