[发明专利]一种基于神经网络的多模态情感分类方法在审

申请号：	202111294685.1	申请日：	2021-11-03
公开（公告）号：	CN113988201A	公开（公告）日：	2022-01-28
发明（设计）人：	王红滨;邢浩;王勇;周连科;何鸣;王念滨	申请（专利权）人：	哈尔滨工程大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06F16/35;G06N3/04;G06N3/08
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	牟永林
地址：	150001 黑龙江***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于神经网络多模态情感分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于神经网络的多模态情感分类方法，其特征在于：它包括以下步骤：

S1、提取待预测情感图片中的多模态数据，多模态数据包括图片模态、图片对应的标签词模态和文本模态；

S2、分别提取S1中图片模态、图片对应的标签词模态和文本模态的原始向量；

S3、根据S2得到的各模态的原始向量分别计算各模态的指导向量；

S4、分别对S3中得到的各模态的指导向量进行表征混合，获得各模态的重构特征向量；

S5、利用注意力机制对S4中得到的各模态的重构特征向量进行加权平均，生成融合特征向量；

S6、将S5中得到的融合特征向量输入至情感分类模型中，输出分类结果。

2.根据权利要求1中所述的一种基于神经网络的多模态情感分类方法，其特征在于：所述S1中，提取待预测情感图片中的图片模态、图片对应的标签词模态和文本模态的方法包括：

利用图像训练集对ResNet 101模型进行训练，训练完成后的ResNet 101模型作为标签词预测器，将待预测情感图片输入标签词预测器内，并提取待预测情感图片的标签词，得到图片模态、图片对应的标签词模态和文本模态。

3.根据权利要求2中所述的一种基于神经网络的多模态情感分类方法，其特征在于：图像训练集的输入集是图片，输出集是每张待预测情感图片的标签词。

4.根据权利要求1中所述的一种基于神经网络的多模态情感分类方法，其特征在于：所述S2中，分别提取S1中图片模态、图片对应的标签词模态和文本模态的原始向量的方法为：

利用ResNet 50 V2模型提取图片模态的原始向量

I_i表示图片上任意一个区域，i＝1、2、…N_r；

利用Bert模型提取图片对应的标签词模态的原始向量e(a_f)

e(a_f)＝Bert(a_f) 公式2

a_f表示任意一个标签词，f＝1、2、…N_a；

利用Bert模型提取文本模态的原始向量r(t_h)

r(t_h)＝Bert(t_h) 公式3

t_h表示任意一条文本信息，h＝1,2…L。

5.根据权利要求4中所述的一种基于神经网络的多模态情感分类方法，其特征在于：所述Bert模型为distilbert-base-uncased-finetuned-sst-2-english模型。

6.根据权利要求4中所述的一种基于神经网络的多模态情感分类方法，其特征在于：所述S3中，根据S2得到的各模态的原始向量分别计算各模态的指导向量的方法为：

计算图片模态的指导向量v_image

N_r表示图片上区域的个数；

计算图片对应的标签词模态的指导向量v_attr；

N_a表示标签词的数量；

α_f表示任意一个标签词模态的权重值；

计算文本模态的指导向量v_text；

L表示文本的长度。

7.根据权利要求1中所述的一种基于神经网络的多模态情感分类方法，其特征在于：所述S4包括：

分别对S3中得到的各模态的指导向量进行表征混合，获得的各模态权重值总和的平均值

m表示任意一个模态；

n表示除模态m外的其他模态；

表示任意一个模态的权重值；

利用公式7获得各模态的重构特征向量v_m，各模态的重构特征向量v_m相等：

表示模态m下的第j个原始向量；

L_m表示序列的长度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学，未经哈尔滨工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111294685.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于MMKV文件格式的数据恢复方法和系统
下一篇：一种复合式拧紧装置及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于神经网络的多模态情感分类方法在审

专利文献下载