[发明专利]一种基于歌词演唱准确度的检测系统及方法有效
申请号: | 201910872051.6 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110610721B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 王斌 | 申请(专利权)人: | 上海瑞美锦鑫健康管理有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/02;G10L15/04;G10L15/06;G10L15/08;G10L21/0208 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 竺路玲 |
地址: | 201317 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 歌词 演唱 准确度 检测 系统 方法 | ||
1.一种基于歌词演唱准确度的检测系统,其特征在于,包括:
一获取模块,用于获取一演唱歌曲的一音频数据;
一处理模块,连接所述获取模块,用于对所述音频数据中的非人声的频率部分进行过滤;
一分段模块,连接所述处理模块,用于将所述演唱歌曲按照一本歌曲的乐谱节奏对所述处理模块过滤后的所述音频数据进行分段;
一压缩模块,连接所述分段模块,用于将分段后的所述音频数据中的长音数据进行压缩;
一筛选模块,连接所述压缩模块,用于在压缩后的所述长音数据中,将所述音频数据和所述本歌曲进行比较,筛选出歌词准确的所述音频数据;
一训练模块,连接所述筛选模块,用于对筛选出的所述音频数据进行训练;
一计算模块,连接所述训练模块,用于计算训练完成后的所述音频数据与所述本歌曲的歌词的相似度,以获取所述音频数据的准确度;
所述训练模块包括:
一提取单元,用于提取所述音频数据的特征参数;
一训练单元,连接所述提取单元,用于将所述特征参数训练为具体的模型参数,以输出与所述本歌曲对应的歌词的声母和韵母的类别向量;
所述训练单元将所述本歌曲的每个歌词及其对应的演唱歌曲的所述音频数据进行深度学习训练,训练时对所有的所述音频数据使用前向和后向算法,从而将所述特征参数训练为具体的模型参数;
一识别单元,连接所述训练单元,用于识别歌词的所述声母和所述韵母,以输出所述声母和所述韵母的类别向量对应的歌词拼音。
2.根据权利要求1所述的一种基于歌词演唱准确度的检测系统,其特征在于,所述分段模块包括:
一匹配单元,用于将所述音频数据的指定时值与所述本歌曲的歌词进行匹配。
3.根据权利要求1所述的一种基于歌词演唱准确度的检测系统,其特征在于,所述识别单元包括:
一计算子单元,用于计算每个所述歌词之间的转移概率;
一串接分段子单元,连接所述计算子单元,根据所述转移概率将所述演唱歌曲的歌词依次串接成分段歌词;
一解码子单元,连接所述串接分段子单元,用于将所述分段歌词进行解码,以转换成所述歌词拼音输出。
4.一种基于歌词演唱准确度的检测方法,其特征在于,应用于上述权利要求1-3任意一项所述的一种基于歌词演唱准确度的检测系统,所述检测方法包括:
步骤S1、采用一获取模块,以获取一演唱歌曲的一音频数据;
步骤S2、采用一处理模块,对所述音频数据中的非人声的频率部分进行过滤;
步骤S3、采用一分段模块,将所述演唱歌曲按照一本歌曲的乐谱节奏对所述处理模块过滤后的所述音频数据进行分段;
步骤S4、采用一压缩模块,将分段后的所述音频数据中的长音数据进行压缩;
步骤S5、采用一筛选模块,在压缩后的所述长音数据中,将所述音频数据和所述本歌曲进行比较,筛选出歌词准确的所述音频数据;
步骤S6、采用一训练模块,对筛选出的所述音频数据进行训练;
步骤S7、采用一计算模块,计算训练完成后的所述音频数据与所述本歌曲的歌词的相似度,以获取所述音频数据的准确度;
于所述步骤S6中,包括:
步骤S61、采用一提取单元,以提取所述音频数据的特征参数;
步骤S62、采用一训练单元,将所述特征参数训练为具体的模型参数,以输出与所述本歌曲对应的歌词的声母和韵母的类别向量;
步骤S63、采用一识别单元,将歌词的所述声母和所述韵母进行识别,以输出所述声母和所述韵母的类别向量对应的歌词拼音;
所述步骤S62中,采用所述训练单元,将所述本歌曲的每个歌词及其对应的演唱歌曲的所述音频数据进行深度学习训练,训练时对所有的所述音频数据使用前向和后向算法,从而将所述特征参数训练为具体的模型参数。
5.根据权利要求4所述的一种基于歌词演唱准确度的检测方法,其特征在于,于所述步骤S3中,包括:
步骤S31、采用一匹配单元,将所述音频数据的指定时值与所述本歌曲的歌词进行匹配。
6.根据权利要求4所述的一种基于歌词演唱准确度的检测方法,其特征在于,于所述步骤S63中,包括:
步骤S631、采用一计算子单元,计算每个所述歌词之间的转移概率;
步骤S632、采用一串接分段子单元,根据所述计算子单元计算出每个所述歌词之间的转移概率,将所述演唱歌曲的歌词依次串接成分段歌词;
步骤S633、采用一解码子单元,将所述分段歌词进行解码,以转换成所述歌词拼音输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海瑞美锦鑫健康管理有限公司,未经上海瑞美锦鑫健康管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910872051.6/1.html,转载请声明来源钻瓜专利网。