[发明专利]基于语谱切分的唱歌评测系统有效
申请号: | 201010232918.0 | 申请日: | 2010-07-16 |
公开(公告)号: | CN101894552A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 魏思;蒋成林;胡国平;刘丹;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/08;G10L15/02;G10H1/36 |
代理公司: | 合肥诚兴知识产权代理有限公司 34109 | 代理人: | 汤茂盛;王挺 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 切分 唱歌 评测 系统 | ||
技术领域
本发明涉及唱歌领域的语音信号处理系统,具体涉及一种基于语谱切分的唱歌评测系统。
背景技术
目前在自动唱歌评测系统主要有以下几种由简单到复杂的技术方案:
1)、仅考察用户的发音时间和音量:通过比较测试数据帧能量和原唱数据帧能量,将比较得到的一致性程度量化成评分分数,如专利号为9610613.4的发明专利“卡拉OK计分的方法和系统”所记载的评测方法。
这种做法只是通过考察用户的音量高低和原唱的音量高低来判断唱歌好坏,而不是分析用户唱歌时的音高、节奏等反映唱歌水平的信息,评分准则与人工评分的考量因素不一致。
2)、仅考察用户唱歌时的音高偏差程度:也即主要考察用户唱歌数据的基频曲线和标准的基频曲线之间的差异程度,这种评测方法通过比较标准基频曲线和唱歌数据基频曲线之间的误差面积,来评价唱歌数据的好坏;误差面积值越大,用户唱歌数据得分越低,反之,则用户唱歌数据得分越高。
实际评测时,通过误差面积来评价唱歌数据的好坏存在相当的问题,比如当音高走势相同时,如果用户唱歌的节奏比标准的节奏超前或者滞后,则自动评分系统给出的分数就会很低,也即即便用户的音高与标准的音高走势完全一致,由于用户的音高与标准的音高在时间上的不一致性,用户所得的评分也会较低;如图2所示,上框10为伴奏数据,下框20为待评测的唱歌数据(也即用户的唱歌数据),斜线30表示上框10中的标准曲谱时间上的位置和下框20中的待评测的唱歌数据在时间上的对应关系,由图2明显可得,用户唱歌的节奏显然比标准的节奏滞后,此时即便用户的音高与标准的音高走势完全一致,用户的评分也会很低。
自动评分系统只有有效判断出用户的音高与标准的音高在时间上的不一致性,并进行有效处理,才能得到比较合理的打分结果。
3)、同时考察音高和节奏上的偏差:针对2)中存在的仅考察音高评分导致的不合理性,有人提出基频的动态时间规整(DTW:Dynamic Time Warping)算法,以此来改善测试基频和标准基频之间时间上的对应关系。
动态时间规划算法的基本思想是将时间的规整和距离测度规整结合在一起的一种非线性规整技术,通过在允许的时间规整范围内寻找距离测度最小的时间上的规整方式,进而确定输入信号和模板在时间上的对应关系,在一定程度上克服了标准基频和测试基频在时间上不严格对齐时带来的干扰。然而由于这种算法忽略了唱歌数据中的歌词信息而仅仅考虑了基频的相似程度,没有充分利用唱歌数据的信息,使得标准基频和测试基频对齐的准确程度不高,从而导致了评分效果不尽理想。
发明内容
本发明的目的是提供一种基于语谱切分的唱歌评测系统,其提高了标准基频和测试基频在时间对齐上的准确性,改善了唱歌评测系统的评测性能。
为实现上述目的,本发明采用了以下技术方案:一种基于语谱切分的唱歌评测系统,包括如下步骤:
步骤1、进行语谱模型训练和歌曲资源库的制作,包括如下过程:
a)、语谱模型训练:
(1)首先选择要录音的歌曲,在伴奏的提示下录制纯人声的唱歌数据,并对每份唱歌数据人工标注出唱词内容;
(2)然后使用录音语料和标注结果训练唱歌数据的语谱模型;
b)、歌曲资源库的制作
使用乐谱、歌词文本标注原唱歌曲中每个唱词以及每个音调的音高信息;
步骤2、对演唱进行评测:
c)、根据每份待评测的唱歌数据和对应的唱词内容,使用语谱模型解码的方式确定每个唱词的边界;
d)、根据步骤c)中的语谱切分结果计算每份待评测数据的音高以及节奏得分,并给出总分。
基于以上的技术方案,本发明具有以下优点:
本发明通过制作覆盖全面的清唱数据库训练出与待评测的数据风格完全匹配的语谱模型,引入频谱特征,通过频谱解码的方式,准确定位出数据中每个唱词的位置,进而确定每个音调的位置,最终改善唱歌评测系统的评测性能。
本发明中提出的基于语谱的唱词边界定位方式,大大的改善了标准基频和测试基频在时间对齐上的准确性,经测试,使用语谱模型确定唱词边界和仅仅使用基频相比较,自动评分系统的对齐错误率相对下降达到60%以上。
附图说明
图1是本发明的流程框图;
图2是按照拼音序列所搭建的解码网络示意图;
图3是使用语谱模型确定每个唱词边界的示意图。
具体实施方式
下面结合图1~3对本发明的实现过程做具体说明:
a)、语谱模型训练
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010232918.0/2.html,转载请声明来源钻瓜专利网。