[发明专利]一种发声方式判别方法及系统有效
申请号: | 202011044151.9 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112201226B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 李伟;江益靓;孙校珩;钱家乐 | 申请(专利权)人: | 复旦大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L25/24;G10L25/51;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于声音识别技术领域,具体为一种发声方式判别方法及系统。本发明方法包括:获取各发声方式对应的音频数据;采用滑窗方式在各音频数据上连续截取设定长度的音频作为样本数据,相邻样本数据有设定量的重叠;对各样本数据进行降采样、分帧加窗、傅立叶变换以及梅尔滤波,得到各样本数据的梅尔谱;对样本数据的梅尔谱进行标准化,以样本数据标准化后的梅尔谱为输入,以Adam为优化函数,以交叉熵为损失函数训练神经网络;采用训练好的神经网络对待识别音频数据进行发声方式的判别。本发明简化了发声方式的判别方法,降低了成本。本发明在相关源任务即歌声技巧分类的任务上做了预训练,加快了神经网络的训练速度。 | ||
搜索关键词: | 一种 发声 方式 判别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011044151.9/,转载请声明来源钻瓜专利网。
- 上一篇:桶装水的桶盖
- 下一篇:一种喷头补偿打印方法、装置、打印设备和储存介质