[发明专利]情绪识别方法、装置及计算机可读存储介质有效
申请号: | 201910223763.5 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109859772B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 彭俊清;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/24;G06N3/049;G06N3/045;G10L25/18 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;张超艳 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本方案涉及人工智能,提供一种情绪识别方法、装置及计算机可读存储介质,方法包括:接收音频数据,针对音频数据生成语音频谱图,并将语音频谱图输入到第一识别模块,音频数据则输入到第二识别模块,其中,第一识别模块采用依次连接的DCNN、RNN网络来提取出第一特征向量,第二识别模块从音频数据中提取MFCC,MFCC通过非线性变换成为第二特征向量;将第一、第二识别模块输出的第一、第二特征向量连接起来组成联合特征并依次输入全连接层、softmax层,进行情绪识别。本方案DCNN、RNN结合有助于模拟微妙的局部情绪线索,MFCC在短时间内描述语音特征,通过两种特征提取方式,捕获更多情绪相关特征,提高情绪识别率。 | ||
搜索关键词: | 情绪 识别 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种情绪识别方法,应用于电子装置,其特征在于,包括以下步骤:接收音频数据,针对音频数据生成语音频谱图,并将语音频谱图输入到第一识别模块,而音频数据则输入到第二识别模块,其中,第一识别模块采用依次连接的DCNN、RNN网络来提取出第一特征向量,第二识别模块从音频数据中提取MFCC,所述MFCC通过非线性变换成为第二特征向量;将第一识别模块、第二识别模块输出的第一特征向量、第二特征向量连接起来组成联合特征,将联合特征依次输入全连接层、softmax层,进行情绪识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910223763.5/,转载请声明来源钻瓜专利网。