[发明专利]汉语语音情感信息的提取及建模方法无效

专利信息
申请号: 200810104541.3 申请日: 2008-04-21
公开(公告)号: CN101261832A 公开(公告)日: 2008-09-10
发明(设计)人: 毛峡;陈立江 申请(专利权)人: 北京航空航天大学
主分类号: G10L15/00 分类号: G10L15/00;G10L15/08;G10L15/28;G10L15/06
代理公司: 北京慧泉知识产权代理有限公司 代理人: 王顺荣;唐爱华
地址: 100083北京市海淀区学院*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明一种汉语语音情感信息的提取及建模方法,该汉语语音情感信息的提取方法为:制定情感语音数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;收集情感语音数据;情感语音有效性评测,即由区别于说话者的至少十名评测者对情感语音数据进行主观听取评测实验。该汉语语音情感信息的建模方法为:提取语音情感特征,确定区分各种情感类别的特征组合;采用不同的特征组合训练多级语音情感识别系统的SVM模型;验证该分类模型的识别效果:即采用交叉留一法验证语音情感多极分类模型在说话人无关情况下的分类效果。本发明解决了国内情感语音数据库情感种类较少以及国内情感语音数据库匮乏的问题,同时实现了高效的语音情感识别系统。
搜索关键词: 汉语 语音 情感 信息 提取 建模 方法
【主权项】:
1、一种汉语语音情感信息的提取方法,其特征在于:该提取方法步骤如下:步骤1:制定情感语音数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;步骤2:收集情感语音数据步骤2.1:录音地点为一间空旷的实验室,录音时将门窗紧闭,录制时间选择在晚上,录音设备采用华硕M2413N-DR笔记本电脑,外接创新Audigy 2 NX USB接口声卡,头带式麦克风,录音软件采用的是GoldWave,录音时只有操作者和说话者在场,尽量保持室内安静;步骤2.2:记录说话者的个人信息及录音场地的温度、湿度等环境参数,并请说话者以最高音量发音,调整声卡增益以及麦克风与说话者嘴部距离,保证语音波形不会出现削顶;步骤2.3:请说话者以指定的情感朗读某一录音脚本,重复三遍;步骤2.4:请说话者对录制语音进行个人评价,如符合本人的表达意愿,则将结果保存为采样率11025Hz,16Bit双声道PCM编码格式的WAV文件,否则重复步骤2.3;步骤2.5:分别以悲伤、愤怒、惊奇、恐惧、喜悦、厌恶以及平静7种情感状态和20句录音脚本重复步骤2.3和步骤2.4;步骤2.6:采用GoldWave软件对步骤2.5得到的语音文件进行拆分,得到420句情感语音;步骤2.7:更换说话者重复步骤2.2至步骤2.6,得到15名说话者,包括7男8女,共6300条情感语音数据;步骤3:情感语音有效性评测,即由区别于说话者的至少十名评测者对步骤2.7得到的情感语音数据进行主观听取评测实验。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810104541.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top