[发明专利]基于多粒度动静态融合特征的语音情感识别方法、装置、系统及存储介质在审
申请号: | 201910496244.6 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110246518A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 李海峰;徐聪;马琳;薄洪健;丰上;陈婧;李洪伟;王子豪;孙聪珊 | 申请(专利权)人: | 深圳航天科技创新研究院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/03;G10L25/18;G10L25/45 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 黎健任 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于多粒度动静态融合特征的语音情感识别方法、装置、系统及存储介质,该语音情感识别方法包括如下步骤:第一步,帧计算步骤:以帧为单位计算出每一帧的韵律学特征、谱相关特征及声音质量特征;第二步,段粒度特征的提取步骤:通过统计计算得到整句语料的大粒度静态全局特征,同时利用高斯窗对在时序上相邻的帧特征进行卷积,得到多粒度时变动态特征。本发明的有益效果是:本发明提出多粒度动静态特征融合情感语音分析技术,对语音从三个不同的粒度进行特征的提取,从而得到多粒度时变动态特恒,使得特征既能刻画说话人的总体语音特征,又能描述语音情感特征随时间的变化,让提取的特征更加有效。 | ||
搜索关键词: | 语音情感 存储介质 时变 融合 时序 动态特征 计算步骤 静态特征 粒度特征 情感语音 全局特征 统计计算 语音特征 质量特征 大粒度 高斯窗 卷积 语料 语音 刻画 分析 | ||
【主权项】:
1.一种基于多粒度动静态融合特征的语音情感识别方法,其特征在于,包括如下步骤:第一步,帧计算步骤:以帧为单位计算出每一帧的韵律学特征、谱相关特征及声音质量特征;第二步,段粒度特征的提取步骤:通过统计计算得到整句语料的大粒度静态全局特征,同时利用高斯窗对在时序上相邻的帧特征进行卷积,得到多粒度时变动态特征,使得多粒度时变动态特征既能刻画说话人的总体语音特征,又能描述语音情感特征随时间的变化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳航天科技创新研究院,未经深圳航天科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910496244.6/,转载请声明来源钻瓜专利网。