[发明专利]一种基于SE卷积网络的乐器识别方法及系统有效
申请号: | 201910569242.5 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110310666B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 尹学渊;祁松茂;江天宇 | 申请(专利权)人: | 成都潜在人工智能科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L21/10 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 贺理兴 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于SE卷积网络的乐器识别方法及系统,方法包括如下步骤:待识别数据预处理,将待识别音频文件转换为待识别自相关谱图;待识别数据识别,将待识别自相关谱图输入预先构建的乐器识别模型进行识别,得到输出结果矩阵;乐器解析,将乐器识别模型的输出结果矩阵整合解析为自然语言表示的乐器标签。该方法将待识别音频文件转换为自相关谱图,自相关谱图采用自相关算法,能够有效克服短时傅里叶变换的不足,利用预先构建的乐器识别模型对自相关谱图进行处理,能够识别出音频数据所使用的乐器种类,对真实场景的复调音乐有着较高的识别率,且识别速度较快,可以极大地降低人工成本,节省时间,提升效率。 | ||
搜索关键词: | 一种 基于 se 卷积 网络 乐器 识别 方法 系统 | ||
【主权项】:
1.一种基于SE卷积网络的乐器识别方法,其特征在于:包括如下步骤:待识别数据预处理,将待识别音频文件转换为待识别自相关图谱;待识别数据识别,将待识别自相关图谱输入预先构建的乐器识别模型进行识别,得到一个s行num_ins列的矩阵,其中s代表音乐被切分的片段数目,num_ins代表可识别的乐器种类数;乐器解析,将乐器识别模型的输出结果矩阵整合解析为自然语言表示的乐器标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都潜在人工智能科技有限公司,未经成都潜在人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910569242.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种车载听歌识曲装置
- 下一篇:一种基于声学特征的设备故障检测方法