[发明专利]基于频谱平移的情感说话人识别方法有效
申请号: | 200810162450.5 | 申请日: | 2008-11-25 |
公开(公告)号: | CN101419800A | 公开(公告)日: | 2009-04-29 |
发明(设计)人: | 杨莹春;吴朝晖;单振宇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 杭州天勤知识产权代理有限公司 | 代理人: | 胡红娟 |
地址: | 310027浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 频谱 平移 情感 说话 识别 方法 | ||
技术领域
本发明涉及信号处理和模式识别,主要是一种基于频谱平移的情感说 话人识别方法。
背景技术
说话人识别技术是指利用信号处理和模式识别方法,根据说话人的语 音识别其身份的技术。情感说话人识别是训练语音和测试语音中包含情感 语音的说话人识别。在情感说话人识别中,由于受到测试语音和训练语音 情感不一致的影响,系统的识别率将降大幅降低。本专利提出的方法就是 为了减弱训练和测试语音情感不一致引起的系统性能的下降。
目前说话人识别方法主要分成两个步骤,第一个步骤为特征提取,主 要的特征提取方法有梅尔倒谱系数(MFCC),线形预测编码倒谱系数 (LPCC),感觉加权的线性预测系数(PLP)。第二个步骤为说话人识别过 程,包括说话人建模和训练。主要的建模方法有高斯混合模型法(GMM), 通用背景模型法(GMM-UBM),支持向量机(SVM)。
在情感说话人识别中,训练语音通常为中性情感语音,而测试语音包 括各种情感的语音,比如高兴情感语音,悲伤情感语音。所以,解决情感 问题的关键是在训练时也能得到除中性情感语音之外的情感语音。如果只 是让用户提供各种各样的情感语音,显然是不符合应用要求的。一般情况 下,用户只能提供中性语音,因此提出了采用中性情感语音得到与各种情 感语音等效的语音频谱。
发明内容
本发明提供了一种基于频谱平移的情感说话人识别方法。该方法通过 平移语音信号的短时频谱,将中性语音频谱转换成情感语音等效的语音频 谱,降低情感变化因素对说话人识别性能的影响。
共振峰位置的不同是各类情感语音的一个主要差别,通过改变中性语 音的共振峰位置,可以得到与情感语音等效的语音频谱,让系统在训练的 时候熟悉各种情感语音,从而提高情感说话人识别的性能。本专利提出了 一种基于频谱平移的情感说话人识别方法。通过平移中性语音的频谱来改 变共振峰分布,从而得到与情感语音等效的语音频谱。
本发明首先采用平移中性语音频谱的方法,得到和中性语音有不同共 振峰分布的频谱,再从这些频谱中提取情感语音特征,然后采用高斯混合 模型对各类情感特征建立模型,最后采用最大得分方法求出测试语音得 分,并进行识别。
一种基于频谱平移的情感说话人识别方法,包括如下步骤:
(1)音频预处理
采集待测音频信号后,对音频信号依次进行采样量化、去零漂、预加 重和加哈明窗,得到加哈明窗后的语音帧;
(2)频谱平移
加窗后的语音帧经过快速傅立叶变换得到频谱信号,采用频谱平移方 法得到多组分别拥有不同共振峰分布的频谱信号;
由于说话人处于不同情感状态下的语音频谱的共振峰分布情况不同, 通过改变中性语音频谱的共振峰分布就等效于得到该说话人不同情感状 态下的语音的特征;
(3)特征提取
采用美尔滤波器对频谱信号进行滤波,再采用离散余弦压缩得到语音 特征;
(4)说话人识别
训练:采用频谱平移方法对每个说话人的语音提取多种情感语音,并对 每种情感的语音建立一个高斯混合模型;
测试:将按步骤(1)~步骤(3)的流程提取的待测音频信号的语音 特征,计算待测音频信号在各种情感语音高斯混合模型下的得分,采用最 大得分方法计算待测音频信号的得分,得到识别结果。
步骤(1)的音频预处理包括:
1)采样量化
A)用对采集得到的音频信号sa(t)进行滤波,滤波时奈奎斯特频率FN为4KHZ,音频采样率F=2FN,滤波后得到数字音频信号(即数字化的音 频信号)的振幅序列
B)用脉冲编码调制对数字音频信号的振幅序列s(n)进行量化编码, 得到振幅序列的量化表示s’(n);
其中t表示该信号是时间连续信号,n则表示离散信号序列,n取值 时一般可取为连续的自然数。
2)去零漂
A)计算振幅序列的量化表示s’(n)的平均值
B)将振幅序列中的每个振幅值分别减去平均值,得到去零漂后平均 值为0的振幅序列s”(n);
3)预加重
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810162450.5/2.html,转载请声明来源钻瓜专利网。