[发明专利]一种听觉前端与基于注意力的3DCRNN结合的语音情感识别方法在审
申请号: | 202110629472.3 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113327588A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 黄超;张毅;郑凯 | 申请(专利权)人: | 重庆邮智机器人研究院有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L25/63 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 杨柳岸 |
地址: | 401220 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种听觉前端与基于注意力的3DCRNN结合的语音情感识别方法,属于语音信号处理与模式识别领域,包括:S1:利用听觉系统对语音信号进行处理,提取出表征语音情感信息的基于时间调制信号的语谱图;S2:利用3DCNN模型从语谱图中提取情感语音的光谱‑时间特征;S3:通过ARNN提取光谱‑时间特征的长期依赖关系,利用时间注意模型来捕捉与情感相关的重要信息;S4:更新自身的参数使得损失最小,使用验证集对训练后的模型进行10倍交叉验证,交叉熵作为损失函数,用RMSProp算法对模型参数进行优化;S5:使用验证集对训练后的模型验证,调整超参数,最后利用Softmax层进行语音情感分类。 | ||
搜索关键词: | 一种 听觉 前端 基于 注意力 dcrnn 结合 语音 情感 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮智机器人研究院有限公司,未经重庆邮智机器人研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110629472.3/,转载请声明来源钻瓜专利网。