[发明专利]优化频域噪声整形的音频编码方法及装置有效
申请号: | 202011600985.3 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112735449B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 李强;王尧;叶东翔;朱勇 | 申请(专利权)人: | 北京百瑞互联技术有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032 |
代理公司: | 北京国科程知识产权代理事务所(普通合伙) 11862 | 代理人: | 曹晓斐 |
地址: | 100085 北京市海淀区上地信息路2号(北京实创*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 噪声 整形 音频 编码 方法 装置 | ||
1.一种优化频域噪声整形的音频编码方法,其特征在于,包括:
根据经过低延迟改进型离散余弦变换的音频信号计算所述音频信号的语音能量熵;
根据状态转移计数器的当前值、所述音频信号的当前帧的所述语音能量熵及预设的门限值,对所述当前帧进行判断得到非语音帧音频信号、疑似语音帧音频信号或者语音帧音频信号;
当所述当前帧是非语音帧频信号时,对所述非语音帧音频信号在经过频域噪声整形的第一阶段分裂矢量量化之后,不进行所述频域噪声整形过程的第二阶段金字塔矢量量化;
当所述当前帧是疑似语音帧音频信号或者语音帧音频信号时,对所述疑似语音帧音频信号或者语音帧音频信号在经过频域噪声整形的第一阶段分裂矢量量化之后,进行所述频域噪声整形过程的第二阶段金字塔矢量量化;以及
对所述当前帧进行后续编码处理,得到编码结果;
其中,根据所述状态转移计数器的所述当前值对所述音频信号的所述当前帧的前一帧音频信号是否被判断为所述非语音帧进行判断。
2.如权利要求1所述的优化频域噪声整形的音频编码方法,其特征在于,所述根据经过低延迟改进型离散余弦变换的音频信号计算所述音频信号的语音能量熵的过程包括,
根据经过低延迟改进型离散余弦变换的音频信号计算所述音频信号的语音子带能量;
根据所述音频信号的语音子带能量计算所述音频信号的语音子带总能量;
根据所述音频信号的语音子带总能量计算所述音频信号的语音子带能量概率;
根据所述音频信号的所述语音子带能量概率计算所述音频信号的所述语音能量熵。
3.如权利要求1所述的优化频域噪声整形的音频编码方法,其特征在于,所述根据状态转移计数器的当前值、所述音频信号的当前帧的所述语音能量熵及预设的门限值,对所述当前帧进行判断得到非语音帧音频信号、疑似语音帧音频信号或者语音帧音频信号的过程包括,
根据所述当前帧的上一帧的判断结果,对所述状态转移计数器的所述当前值进行设置。
4.如权利要求1所述的优化频域噪声整形的音频编码方法,其特征在于还包括,对所述第二阶段金字塔矢量量化的输出索引和输出向量进行设置。
5.如权利要求1所述的优化频域噪声整形的音频编码方法,其特征在于,所述根据状态转移计数器的当前值、所述音频信号的当前帧的所述语音能量熵及预设的门限值,对所述当前帧进行判断得到非语音帧音频信号、疑似语音帧音频信号或者语音帧音频信号的过程包括,
当所述当前帧的所述语音能量熵大于所述门限值并且前一帧音频信号被判断为所述非语音帧时,将所述当前帧判断为所述非语音帧音频信号;
当所述当前帧的所述语音能量熵大于所述门限值并且所述前一帧音频信号被判断为所述语音帧时,将所述当前帧判断为所述疑似语音帧音频信号;
当所述当前帧的所述语音能量熵不大于所述门限值时,将所述当前帧判断为所述语音帧音频信号。
6.如权利要求4所述的优化频域噪声整形的音频编码方法,其特征在于,所述对所述第二阶段金字塔矢量量化的输出索引和输出向量进行设置的过程包括,
当所述当前帧被判断为所述非语音帧时,将所述第二阶段金字塔矢量量化的输出索引和输出向量清零;
当所述当前帧被判断为所述语音帧时,所述状态转移计数器的所述当前值设置为一预设的安全值;
当所述当前帧被判断为所述疑似语音帧时,所述状态转移计数器的所述当前值减去预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百瑞互联技术有限公司,未经北京百瑞互联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011600985.3/1.html,转载请声明来源钻瓜专利网。