[发明专利]一种基于全局工作空间的可解释情绪识别方法和系统有效
申请号: | 202111045320.5 | 申请日: | 2021-09-07 |
公开(公告)号: | CN114005468B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 沈旭立;沈伟林 | 申请(专利权)人: | 华院计算技术(上海)股份有限公司;复旦大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/51;G10L25/30;G10L25/27;G10L15/06;G10L15/08;G06N20/00 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 王维新 |
地址: | 200072 上海市静*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 工作 空间 可解释 情绪 识别 方法 系统 | ||
1.一种基于全局工作空间的可解释情绪识别方法,其特征在于,所述方法包括:
通过多个预训练模型对相应的输入数据进行分析,获得结果编码;
基于最大经验风险算法,将所述结果编码进行竞争,获得全局工作空间的向量;
基于可解释的人工智能算法,获得所述输入数据的后解释数据;
将所述后解释数据输入到相应的模态模型中,获得第二结果编码;
根据所述向量对所述第二结果编码进行融合,获得融合向量;
将所述融合向量送入全连接层,经归一化后,获得情绪识别结果。
2.根据权利要求1所述的可解释情绪识别方法,其特征在于,所述预训练模型为以下模型的组合:
图像预训练模型、语音预训练模型和语言预训练模型。
3.根据权利要求1所述的可解释情绪识别方法,其特征在于,所述模态模型为以下模型的组合:
图像识别模型、语音识别模型和语言识别模型。
4.根据权利要求3所述的可解释情绪识别方法,其特征在于,所述模态模型参数的学习是通过情绪分类的监督信息得到。
5.根据权利要求1所述的可解释情绪识别方法,其特征在于,所述最大经验风险算法表示为:
其中,θ表示为模型参数,为非线性期望的表示,x代表输入数据,y代表监督信息,gθ为参数化的模型,p(x,y)代表数据分布,N代表模态模型的总数,sj代表用于训练第j个模态模型的样本数量,xjk为第j个模态模型中的第k个数据样本,yjk为xjk的数据标签,为损失函数。
6.根据权利要求5所述的可解释情绪识别方法,其特征在于,获得全局工作空间的向量的方法包括:
根据模型参数,对损失函数求梯度后,组合为矩阵G:
其中,表示为基于第一预训练模型的模型参数θI对损失函数求梯度,V表示为第二预训练模型的模型参数,θL表示为第三预训练模型的模型参数,T表示为转置符号;
全局工作空间的向量δ表示为:
δ=-GTλ (3)
其中,λ表示为拉格朗日乘子。
7.根据权利要求6所述的可解释情绪识别方法,其特征在于,通过以下公式求解拉格朗日乘子为:
8.根据权利要求1所述的可解释情绪识别方法,其特征在于,所述后解释数据包括输入数据及其表征,所述表征包括图片数据的解释图、语音数据的解释图或自然语言的表征。
9.根据权利要求1所述的可解释情绪识别方法,其特征在于,所述融合向量表示为:
z融合=[z′i+δ,z′V+δ,z′L+δ] (4)
其中,z融合表示为融合向量,z′I表示为第一模态模型输出的第二结果编码,z′V表示为第二模态模型输出的第二结果编码,z′L表示为第三模态模型输出的第二结果编码,δ表示为向量。
10.一种用于实现如权利要求1-9任一项所述可解释情绪识别方法的系统,其特征在于,包括预训练模块、竞争模块、可解释模块、分析模块、融合模块和识别模块,
所述预训练模块用于通过多个预训练模型对相应的输入数据进行分析,获得结果编码;
所述竞争模块基于最大经验风险算法,将所述结果编码进行竞争,获得全局工作空间的向量;
所述可解释模块基于可解释的人工智能算法,获得所述输入数据的后解释数据;
所述分析模块用于将所述后解释数据输入到相应的模态模型中,获得第二结果编码;
所述融合模块用于根据所述向量对所述第二结果编码进行融合,获得融合向量;
所述识别模块用于将所述融合向量送入全连接层,经归一化后,获得情绪识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华院计算技术(上海)股份有限公司;复旦大学,未经华院计算技术(上海)股份有限公司;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111045320.5/1.html,转载请声明来源钻瓜专利网。