[发明专利]基于自注意力机制的多模态情感识别方法有效
申请号: | 202010368593.2 | 申请日: | 2020-05-01 |
公开(公告)号: | CN111553295B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 傅湘玲;欧阳天雄;王莉;杨国胜;闫晨巍 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06N3/094;G06N3/0475;G06F18/25;G06F18/213;G06N3/0442 |
代理公司: | 北京格允知识产权代理有限公司 11609 | 代理人: | 张莉瑜 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 多模态 情感 识别 方法 | ||
1.一种基于自注意力机制的多模态情感识别方法,其特征在于,包括如下步骤:
S1、获取不同模态的数据,数据中每条样本均包括多维情感特征;
S2、对各个模态,将每条样本中的多维情感特征分组,得到各组相应的特征向量;针对各组内情感特征的相关性建模并抽取高维特征;
S3、对各个模态,根据自注意力机制,将抽取到的高维特征通过一层线性层映射成query、key和value特征;对每一个高维特征,计算其对异构模态所有高维特征的注意力权重;根据注意力权重计算模态间融合的情感信息;基于需要融合的情感信息对每个高维特征进行更新;
S4、对各个模态,根据自注意力机制,将更新后的高维特征通过一层线性层映射成query、key和value特征,并引入跨模态的情感信息更新每个高维特征的query特征和key特征;对每一个高维特征,计算其对于所属模态所有高维特征的注意力权重;根据注意力权重计算模态内融合的情感信息;基于需要融合的情感信息对每个高维特征进行再次更新;
S5、对每一类情感,分别构建N个情感强度检测器,每个所述情感强度检测器由拥有独立参数的卷积神经网络构成;将再次更新后的高维特征输入对应的所述情感强度检测器,每个所述情感强度检测器输出其对于当前情感类别的激活强度值,进而得到情感相关矩阵;根据情感相关矩阵提供的权重集结每个模态下的各个高维特征,形成单模态情感特征;
S6、对每一类情感,采用双线性网络融合各模态的单模态情感特征,并输入二分类全连接网络,输出属于该情感类别的概率;对各类情感概率进行归一化,输出概率最大的情感类别。
2.根据权利要求1所述的多模态情感识别方法,其特征在于:
所述步骤S1中获取的数据包括脑电信号数据和眼动信号数据两个不同模态的数据。
3.根据权利要求2所述的多模态情感识别方法,其特征在于:
所述步骤S2中,将每条样本中的多维情感特征分组时,对脑电信号数据,根据多维情感特征的区域性进行分组,分为16组,对于眼动信号数据,根据多维情感特征的类型进行分组,分为5组;得到各组相应的特征向量表达式如下:
其中,脑电信号数据对应的多维情感特征62为脑电帽电极数,每个特征vj包含脑电信号在5个波段上提取的微分熵,眼动信号数据对应的多维情感特征31为眼动信号数据对应的特征总数,特征q1-q12为瞳孔直径特征,q13-q16为眼球扫视特征,q17-q18为眼球注视特征,q19-q22为注视偏差特征,q23-q31为统计事件特征,为第j组脑电特征向量,nj(j=1,2,…,16)为第j组脑电区域的电极数目,为第j组眼动特征向量,mj(j=1,2,…,5)为第j组眼动特征的特征数目。
4.根据权利要求3所述的多模态情感识别方法,其特征在于:
所述步骤S2中,针对各组内情感特征的相关性建模并抽取高维特征时,对脑电信号数据,采用双向长短时记忆网络进行建模,记L(·;θ)为双向长短时记忆网络前向操作,其输出隐层为:
其中,θ为网络可学习参数,dr表示隐层的维数,hi(i=1,2,…,nj)表示隐层的特征向量;
将第j组脑电区域特征向量输入,抽取出双向长短时记忆网络的最后一层隐层的向量作为脑电高维特征输入各组脑电区域特征向量,得到高维特征向量记为Hieeg:
对眼动信号数据,采用具有一层隐层的全连接网络进行建模,令σj(·;θ)为带非线性激活函数的线性映射层,抽取出高维特征向量记为Hieye:
其中,为第j组眼动高维特征,θ为网络参数,d为线性层的输出维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010368593.2/1.html,转载请声明来源钻瓜专利网。