[发明专利]一种基于挑选峰的连续语音共振峰提取方法在审

申请号：	202210492452.0	申请日：	2022-05-07
公开（公告）号：	CN115064180A	公开（公告）日：	2022-09-16
发明（设计）人：	邹欣航;叶蕾;孙林慧;陈雪红	申请（专利权）人：	南京邮电大学
主分类号：	G10L21/003	分类号：	G10L21/003;G10L19/04
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	楼然
地址：	210046 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于挑选连续语音共振提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于挑选峰的连续语音共振峰提取方法，其特征在于，包括以下步骤：

步骤1.对输入的单帧语音进行预处理操作；

步骤2.采用线性预测法，初步估算一帧语音频谱包络中的峰值；

步骤3.设立参考点和共振峰槽，然后利用挑选峰方法建立峰值与参考点之间的映射关系；

步骤4.利用峰值和参考点间的映射关系和共振峰槽确定一帧语音的共振峰；

步骤5.针对连续语音进行共振峰估算；

所述的步骤1包括：

利用短时平均幅度函数M_n区别一帧语音中有声和无声的区域：

式中，x_n(m)是原始语音信号经过加窗分帧处理后得到的第n帧语音信号；

然后根据频谱的总能量和640-2880Hz区域的能量将有声区域分为元音区和非元音区。

2.根据权利要求1所述的一种基于挑选峰的连续语音共振峰提取方法，其特征在于，利用线性预测法求得一帧语音的线性预测系数，采用全极点模型建立声道的传递函数；同时根据绝大多数男性女性的语音特点，初步估计出一帧语音频谱包络中的共振峰频率和带宽。

3.根据权利要求1所述的一种基于挑选峰的连续语音共振峰提取方法，其特征在于，在步骤3中，所述的设立参考点和共振峰槽、建立参考点和峰值的映射关系，包括以下步骤：

步骤3.1.设立参考点：

对于绝大多数男性的语音，设置四个参考点处的估计分别为E₁＝320Hz，E₂＝1440Hz，E₃＝2760Hz，E₄＝3200Hz；对绝大多数女性的语音，设置四个参考点处的估计分别为E₁＝480Hz，E₂＝1760Hz，E₃＝3200Hz，E₄＝3520Hz；

步骤3.2.设立存储峰值的共振峰槽：

在每一帧语音中，设定三个共振峰槽S₁、S₂、S₃；同时额外设定一个共振峰槽S₄，S₄的存在只是为了防止可能出现的第四个峰值P₄和P₃竞争S₃的位置；在最后的共振峰估计结果中，去掉S₄和填补S₄的峰值；

步骤3.3.建立参考点和峰值的映射关系：

在120Hz-3600Hz之间找到所有峰值，记录下峰值频率和大小；距离参考点E_i最近的符合共振峰条件的4个峰值会被填入对应的4个共振峰槽位；如果整段频谱只有一个合适峰值，则会用该峰值去填补所有的共振峰槽位；初步挑选共振峰并填入对应的槽位之后，为保证每个共振峰槽位都被填满，分别对未分配的共峰值和未填满的槽位进行处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210492452.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于挑选峰的连续语音共振峰提取方法在审

专利文献下载