[发明专利]基于语谱切分的唱歌评测系统有效

申请号：	201010232918.0	申请日：	2010-07-16
公开（公告）号：	CN101894552A	公开（公告）日：	2010-11-24
发明（设计）人：	魏思;蒋成林;胡国平;刘丹;胡郁;刘庆峰	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/14;G10L15/08;G10L15/02;G10H1/36
代理公司：	合肥诚兴知识产权代理有限公司 34109	代理人：	汤茂盛;王挺
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于切分唱歌评测系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及唱歌领域的语音信号处理系统，具体涉及一种基于语谱切分的唱歌评测系统。

背景技术

目前在自动唱歌评测系统主要有以下几种由简单到复杂的技术方案：

1)、仅考察用户的发音时间和音量：通过比较测试数据帧能量和原唱数据帧能量，将比较得到的一致性程度量化成评分分数，如专利号为9610613.4的发明专利“卡拉OK计分的方法和系统”所记载的评测方法。

这种做法只是通过考察用户的音量高低和原唱的音量高低来判断唱歌好坏，而不是分析用户唱歌时的音高、节奏等反映唱歌水平的信息，评分准则与人工评分的考量因素不一致。

2)、仅考察用户唱歌时的音高偏差程度：也即主要考察用户唱歌数据的基频曲线和标准的基频曲线之间的差异程度，这种评测方法通过比较标准基频曲线和唱歌数据基频曲线之间的误差面积，来评价唱歌数据的好坏；误差面积值越大，用户唱歌数据得分越低，反之，则用户唱歌数据得分越高。

实际评测时，通过误差面积来评价唱歌数据的好坏存在相当的问题，比如当音高走势相同时，如果用户唱歌的节奏比标准的节奏超前或者滞后，则自动评分系统给出的分数就会很低，也即即便用户的音高与标准的音高走势完全一致，由于用户的音高与标准的音高在时间上的不一致性，用户所得的评分也会较低；如图2所示，上框10为伴奏数据，下框20为待评测的唱歌数据(也即用户的唱歌数据)，斜线30表示上框10中的标准曲谱时间上的位置和下框20中的待评测的唱歌数据在时间上的对应关系，由图2明显可得，用户唱歌的节奏显然比标准的节奏滞后，此时即便用户的音高与标准的音高走势完全一致，用户的评分也会很低。

自动评分系统只有有效判断出用户的音高与标准的音高在时间上的不一致性，并进行有效处理，才能得到比较合理的打分结果。

3)、同时考察音高和节奏上的偏差：针对2)中存在的仅考察音高评分导致的不合理性，有人提出基频的动态时间规整(DTW：Dynamic Time Warping)算法，以此来改善测试基频和标准基频之间时间上的对应关系。

动态时间规划算法的基本思想是将时间的规整和距离测度规整结合在一起的一种非线性规整技术，通过在允许的时间规整范围内寻找距离测度最小的时间上的规整方式，进而确定输入信号和模板在时间上的对应关系，在一定程度上克服了标准基频和测试基频在时间上不严格对齐时带来的干扰。然而由于这种算法忽略了唱歌数据中的歌词信息而仅仅考虑了基频的相似程度，没有充分利用唱歌数据的信息，使得标准基频和测试基频对齐的准确程度不高，从而导致了评分效果不尽理想。

发明内容

本发明的目的是提供一种基于语谱切分的唱歌评测系统，其提高了标准基频和测试基频在时间对齐上的准确性，改善了唱歌评测系统的评测性能。

为实现上述目的，本发明采用了以下技术方案：一种基于语谱切分的唱歌评测系统，包括如下步骤：

步骤1、进行语谱模型训练和歌曲资源库的制作，包括如下过程：

a)、语谱模型训练：

(1)首先选择要录音的歌曲，在伴奏的提示下录制纯人声的唱歌数据，并对每份唱歌数据人工标注出唱词内容；

(2)然后使用录音语料和标注结果训练唱歌数据的语谱模型；

b)、歌曲资源库的制作

使用乐谱、歌词文本标注原唱歌曲中每个唱词以及每个音调的音高信息；

步骤2、对演唱进行评测：

c)、根据每份待评测的唱歌数据和对应的唱词内容，使用语谱模型解码的方式确定每个唱词的边界；

d)、根据步骤c)中的语谱切分结果计算每份待评测数据的音高以及节奏得分，并给出总分。