[发明专利]一种基于空耳文本的音乐检索方法在审

专利信息
申请号: 202011095696.2 申请日: 2020-10-14
公开(公告)号: CN112380376A 公开(公告)日: 2021-02-19
发明(设计)人: 叶洪良;朱皖宁 申请(专利权)人: 金陵科技学院
主分类号: G06F16/632 分类号: G06F16/632
代理公司: 南京众联专利代理有限公司 32206 代理人: 蒋昱
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 音乐 检索 方法
【说明书】:

本发明公开了一种基于空耳文本的音乐检索方法,该方法首先将空耳文本进行罗马化的操作,使之变成一个同一标准的编码,随后采用了一个TextToHumming框架,该框架采用WaveNet作为声码器,并且在输入进WaveNet之前,通过一个编码器,捕获文本之间的高阶映射。通过该框架,通过将空耳的文本转换成相应的音乐哼唱片段。然后我们改进了现有的DTW算法,为DTW算法添加了浮动系数,使之更加适用通过空耳文本生成的哼唱音乐的检索。通过以上方法,解决了目前通过空耳寻找歌曲难度大的问题。

技术领域

本发明属于数据检索技术领域,特别涉及一种基于空耳文本的音乐检索方法。

背景技术

随着数字音乐的普及,在大型数字音乐数据库中搜索所需的音乐需要高效的索引和检索 工具。传统的音乐检索系统中,通常都有按照标题或者歌手检索音乐。在基于内容的音乐检 索系统中,歌唱/哼唱查询是一种具有代表性的方便、智能的方法。它可以用于根据用户哼唱 的音乐旋律检索没有歌手姓名和歌曲标题的音乐文件。但是由于找歌者的心理因素或者是歌 唱水平限制,歌唱/哼唱查询并不能满足找歌者的需求,反观在网络上存在着大量的找歌者通 过空耳文本来求助网络,寻找自己想要的歌曲。但是,除了找歌者刚好听过这首歌,几乎很 难从庞大的音乐数据库中查询相关曲目。故研究出一个通过空耳来寻找音乐的方法是非常有 必要的。

发明内容

本发明提供一种基于空耳文本的音乐检索方法,模型基于WaveNet声码器和DTW算法,主要解决找歌者的心理因素或者是歌唱水平限制,歌唱/哼唱查询并不能满 足找歌者的需求,反观在网络上存在着大量的找歌者通过空耳文本来求助网络, 寻找自己想要的歌曲。但是空耳文本的模糊性导致很难从庞大的音乐数据库中找 到该歌曲问题,本专利提供一种基于空耳文本的音乐检索方法,操作过程基于编码器和 WaveNet的TextToHumming框架,该框架由一个编码器和一个WaveNet声码器组成,具体步 骤如下,其特征在于:

1)将空耳文本进行罗马化的操作,使之变成一个同一标准的编码随后采用了一个TextToHumming框架,该框架采用WaveNet作为声码器,并且在输入进WaveNet之前,通 过一个编码器,捕获文本之间的高阶映射,通过该框架,通过将空耳的文本转换成相应的 音乐哼唱片段,具体算法流程如下:

11)获取空耳文本,如果空耳文本为统一标准,则不需要对该空耳文本进行处理,否 则将其进行罗马化处理,将其转换为拉丁字符;

12)通过对拉丁字符进行处理,转换成输入矩阵X;

13)对WaveNet的输出进行缩放,缩放采用μ-law压缩变换,将输出的波形 的值压缩至可接受的范围,设将输出值压缩至K,采用以下函数对输出进行压缩:

其中yt为原本输出的一个分量,其范围为-1yt<1;

14)编码器采用KL loss作为损失函数,定义如下,设Y为原始输出,设Y'为预 测值,则损失函数的表达式为:

15)WaveNet声码器除了输入层的大小变为编码器的输出大小,网络的架构采 用WaveNet采用原始的架构和损失函数,即网络扩张率为2k,其中K表示网络 处于第几层,卷积核的大小为3.除此之外,每个残差层都包含一个ReLu非线 性激活函数;

16)将预测值通过μ-law逆变换转换为哼唱音频;

2)进行哼唱检索算法,为DTW算法添加了浮动系数,使之更加适用通过空耳文本生成的哼唱音乐的检索,具体算法流程如下:

21)假设D是一组音乐的时间序列的数据库,即D={X1,X2,...,XN},其中N为该 音乐数据库的大小;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011095696.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top