[发明专利]一种发声方式判别方法及系统有效

专利信息
申请号: 202011044151.9 申请日: 2020-09-28
公开(公告)号: CN112201226B 公开(公告)日: 2022-09-16
发明(设计)人: 李伟;江益靓;孙校珩;钱家乐 申请(专利权)人: 复旦大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L25/24;G10L25/51;G06N3/04;G06N3/08
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;陆尤
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发声 方式 判别 方法 系统
【说明书】:

发明属于声音识别技术领域,具体为一种发声方式判别方法及系统。本发明方法包括:获取各发声方式对应的音频数据;采用滑窗方式在各音频数据上连续截取设定长度的音频作为样本数据,相邻样本数据有设定量的重叠;对各样本数据进行降采样、分帧加窗、傅立叶变换以及梅尔滤波,得到各样本数据的梅尔谱;对样本数据的梅尔谱进行标准化,以样本数据标准化后的梅尔谱为输入,以Adam为优化函数,以交叉熵为损失函数训练神经网络;采用训练好的神经网络对待识别音频数据进行发声方式的判别。本发明简化了发声方式的判别方法,降低了成本。本发明在相关源任务即歌声技巧分类的任务上做了预训练,加快了神经网络的训练速度。

技术领域

本发明属于声音识别技术领域,具体涉及一种发声方式判别方法及系统。

背景技术

现有的发声方式判别研究中,大多采用空气动力学特征或声学特征对发声方式进行判别。其中,空气动力学特征主要由声门气压和声门气流决定,可以通过空气动力检测仪收集。空气动力检测仪主要包含信号收集、传输、放大、计算等组成装置,受试者通过面罩向气流计速器中呼气或发音,反映声门气流率的气流信号传导至压力传感器,再经过放大、滤波处理输入计算机中。机器通常接连显示器,展示出平均气流信号、声门上下压信号,计算得到声门阻力和发声效率等指标,能在一定程度上区分发声方式。使用声学特征进行判别,主要分为语音发声场景和歌唱发声场景。语音发声场景下,采用归一化振幅商、最大峰值处值、频谱1000Hz上下的能量比等声学特征进行发声方式区分,与专家判断结果有一定的一致性;歌唱发声场景下,有研究采用谱质心、谱通量、梅尔频率倒谱系数等频域特征结合MDQ、NAQ等声音质量特征对四种发声方式进行判别。

然而,采用空气动力学特征进行发声方式的判断,需要采用空气动力检测仪等设备辅助进行,且需要测试人佩戴相应的设备做出呼气、发音等操作,过程较为繁琐。采用声学特征进行发声方式的判断,需要在众多的声学特征中人工筛选合适的特征,这需要大量的实验测试,耗费大量的人力物力。

发明内容

本发明的目的是提供一种操作简便、成本较低的发声方式判别方法及系统。

本发明提供的发声方式判别方法,具体步骤包括:

(1)获取各发声方式对应的音频数据,所述发声方式包括呼气式发声、自然式发声、抖动式发声以及挤压式发声;

(2)采用滑窗方式在各所述音频数据上连续截取设定长度的音频作为样本数据,相邻所述样本数据有设定量的重叠;

(3)对各所述样本数据进行降采样、分帧加窗、傅立叶变换,通过梅尔滤波器组,得到各样本数据的梅尔谱;

(4)基于训练集的梅尔谱均值与方差,对各样本数据的梅尔谱进行标准化;其中,所述训练集由各样本数据的梅尔谱组成;

(5)以标准化后的各样本数据的梅尔谱作为输入,以Adam为优化函数,以交叉熵为损失函数训练一个用于发声方式判别的卷积神经网络,得到训练好的神经网络模型;

(6)采用训练好的神经网络模型对待识别音频数据进行发声方式的判别。

可选的,步骤(4)所述基于训练集的梅尔谱均值与方差,对降采样后的各样本数据进行标准化,具体包括:

根据对降采样后的各样本数据进行标准化,其中,Sorigin为样本数据标准化前的梅尔谱,Sstandard为样本数据标准化后的梅尔谱,s为训练集中梅尔谱的方差,μ为训练集中梅尔谱的均值。

可选的,步骤(4)中所述神经网络包括卷积模块和分类模块;其中,所述卷积模块包括四个卷积层、最大池化层和丢弃层,所述分类模块包括三个全连接层。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011044151.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top