[发明专利]基频提取模型的训练方法及装置、基频提取方法及装置在审

申请号：	202111407245.2	申请日：	2021-11-24
公开（公告）号：	CN114067784A	公开（公告）日：	2022-02-18
发明（设计）人：	关海欣;梁家恩	申请（专利权）人：	云知声智能科技股份有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/18;G10L15/20;G10L21/0208;G10L25/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	100096 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基频提取模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基频提取模型的训练方法及装置、基频提取方法及装置，包括：基于预设的干净语音数据库，提取所述干净语音数据库中干净语音的基频信息作为训练目标数据；对所述干净语音进行加噪处理，得到加噪语音；提取所述加噪语音的特征；将所述加噪语音的特征作为待训练模型的输入数据，将所述训练目标数据作为所述待训练模型的输出数据，对所述待训练模型进行训练，得到基频提取模型。本发明实现了对待训练模型的输入数据的降维处理，并利用已知的输出数据进行训练，使得基频提取模型的训练效率有较大的提升。

技术领域

本发明涉及语音降噪技术领域，具体涉及一种基频提取模型的训练方法及装置、基频提取方法及装置。

背景技术

语音降噪中有个比较好的倒谱平滑技术，针对神经网络模型降噪存在的伪谱和语音谐波间残留有较好的后处理效果，但是其本身依赖于语音基音频率(以下称基频)较为准确的估计。

由于，基于传统信号的基频提取方法，如基于相关性、倒谱、累积差分(YIN算法)等方法，在噪声下均表现不佳，并且即使在安静场景下，由于语音的谐波特性，也很容易出现半频、倍频问题，往往需要动态规划DP算法后处理，去除野点，但倍频、半频依然是两个相互矛盾问题，难以同时完全克服；再者，基于传统信号的基频提取方法往往需要使用较长帧以获取足够周期性，这导致预测延迟较大，对于实时性要求较高场景也不太适用。相关技术提出了基于神经网络模型的基频提取方法，其有时域、频域方法，虽然效果较好，但其输入维度较大，建模困难，需要使用大模型才能对其建模，导致计算量陡增。

因此，如何提高基频提取模型的训练效率是本领域技术人员亟待解决的技术问题。

发明内容

本发明提供一种基频提取模型的训练方法及装置、基频提取方法及装置，以解决现有技术中基频提取模型的训练效率较低的技术问题。

本发明解决上述技术问题的技术方案如下：

一种基频提取模型的训练方法，包括：

基于预设的干净语音数据库，提取所述干净语音数据库中干净语音的基频信息作为训练目标数据；

对所述干净语音进行加噪处理，得到加噪语音；

提取所述加噪语音的特征；

将所述加噪语音的特征作为待训练模型的输入数据，将所述训练目标数据作为所述待训练模型的输出数据，对所述待训练模型进行训练，得到基频提取模型。

进一步地，上述所述的基频提取模型的训练方法中，提取所述加噪语音的特征，包括：

通过分帧、加窗、短时傅里叶变换计算所述加噪语音的幅度谱特征；

对所述加噪语音的幅度谱特征进行降采样，确定所述加噪语音的初始谐波乘积谱；