[发明专利]一种多人对话系统的情绪识别模型在审
申请号: | 202010164874.6 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111460143A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 林小颖;徐向民;邢晓芬;殷瑞祥;郭锴凌 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 系统 情绪 识别 模型 | ||
本发明公开了一种多人对话系统的情绪识别模型,包括S1提取数据集中的特征,所述特征包括文本特征及语音特征;S2根据文本特征及语音特征,构建改进的DialogueRNN网络;S3训练改进的DialogueRNN网络,得到最终的声学模型即情绪识别模型。本发明在考虑模型对现实多人对话场景的建模能力、对上下文信息提取能力及模型的大小等方面的因素下,通过引入Listener的Party State和不同人的Emotion State,提高了DialogueRNN情绪识别模型的性能。
技术领域
本发明属于情绪识别领域,特别涉及一种多人对话系统的情绪识别模型
背景技术
对话系统中的情感识别是许多应用程序的必要步骤,包括聊天记录中的主题挖掘,社交媒体线索,在实时对话中了解消费者反馈等方面。多人对话系统中的情绪识别,上下文信息起到非常重要的作用,利用循环神经网络(Recurrent Neural Network,RNN)可以很好地提取上下文信息,循环神经网络是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。
对循环神经网络的研究始于二十世纪80-90年代,并在二十一世纪初发展为深度学习(deep learning)算法之一,其中双向循环神经网络(Bidirectional RNN,Bi-RNN)和长短期记忆网络(Long Short-Term Memory networks,LSTM)是常见的的循环神经网络。
一般是情绪识别系统分成几个步骤,第一是特征的提取,包括文本,语音,视频等特征,第二是特征的融合,第三是对场景进行建模。
在多人对话系统中,现有的基于RNN的情绪识别模型DialogueRNN可以比较好地刻画现实对话的场景,但跟实际情况也存在一些出入,并不能比较好地模拟实际场景,从这方面来说,基于RNN的多人对话系统中的情绪识别模型DialogueRNN性能有待进一步地提升。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种多人对话系统的情绪识别模型。本发明在考虑模型建模能力、对上下文信息提取能力及模型的大小等方面的因素下,通过引入Listener的Party State和不同人的Emotion State,对现实场景更好地建模,从而提高情绪识别系统整体性能。
本发明的目的通过以下的技术方案实现:
一种多人对话系统的情绪识别模型,包括:
S1提取数据集中的特征,所述特征包括文本特征及语音特征;
S2根据文本特征及语音特征,构建改进的DialogueRNN网络;
S3训练改进的DialogueRNN网络,得到最终的声学模型即情绪识别模型。
所述改进的DialogueRNN网络是在基础的DialogueRNN网络中引入Listener的Party State和不同人的Emotion State,得到改进后的DialogueRNN网络。
所述S2根据文本特征及语音特征,构建改进的DialogueRNN网络,具体为:
将当前时刻的文本特征及语音特征输入Global GRU提取上下文信息的特征gt;
上下文信息的特征(g1g2...gt-1)通过Attention机制得到Context Vector(ct);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010164874.6/2.html,转载请声明来源钻瓜专利网。