[发明专利]基于同一特征空间的图文数据融合情感分类方法和装置有效

申请号：	201910097903.9	申请日：	2019-01-31
公开（公告）号：	CN109829499B	公开（公告）日：	2020-10-27
发明（设计）人：	林政;耿悦;付鹏;王伟平	申请（专利权）人：	中国科学院信息工程研究所
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	北京君尚知识产权代理有限公司 11200	代理人：	邱晓锋
地址：	100093 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于同一特征空间图文数据融合情感分类方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于同一特征空间的图文数据融合情感分类方法，其特征在于，包括以下步骤：

1)使用自动编码机提取多模态数据中图片的压缩特征表达；

2)使用CNN-DCNN网络提取多模态数据中文字的压缩特征表达；

3)将步骤1)、2)得到的图片特征和文本特征映射到同一个特征向量空间，得到图文整体特征；

4)通过分类器对步骤3)得到的图文整体特征进行分类，得到情感分类结果；

其中，步骤3)通过统一的损失函数将图片、文本的特征映射到同一个特征向量空间，并将图片特征与文本特征进行组合，形成成对的图文特征；步骤3)包括：

a)设计两个损失函数，一个针对成对的图文特征是否相近，另一个针对预测结果和标签是否一致；

b)将两个损失函数统一成一个损失函数，在同一空间下进行约束；

c)训练网络，使得成对图文特征在空间内尽可能相近并且使得具有相同标签的特征在空间内尽可能相近；

所述两个损失函数为：

针对成对的图文特征是否相近的损失函数：

针对预测结果和标签是否一致的损失函数：

将所述两个损失函数统一成一个损失函数，为：

其中，D(p||q)是p和q的KL散度之和，Δ₁和Δ₂是归一化参数，用来将两个损失函数归一化；表示抽取到第i个图片的图片特征，表示抽取到第i个文本的文本特征；

M(·)是图、文特征的合并过程，C(·)是情感分类过程；θ是控制模型中关注特征相似程度与关注整体分类程度的超参数。

2.根据权利要求1所述的方法，其特征在于，步骤1)所述自动编码机通过输入层将输入图片展开成向量x，通过一个隐藏层h，然后通过输出层x^提取有用的特征，输入层、隐藏层、输出层均是全连接网络，其中输入层和输出层维度一致，隐藏层的神经元数目小于输入层和输出层，自动编码机的网络的目标是最小化输入与输出的差距。

3.根据权利要求1所述的方法，其特征在于，步骤2)使用基于CNN-DCNN网络的编码-解码模型提取输入文本的特征表达，用CNN网络编码文本特征，再用DCNN网络解码，以获取文本的全局信息。

4.根据权利要求1所述的方法，其特征在于，步骤4)所述分类器为随机森林分类器。

5.根据权利要求1所述的方法，其特征在于，所述自动编码机使用ILSVRC-2012数据集进行预训练，所述CNN-DCNN网络在其他的中文文本上，使用预训练Word2Vec的语料进行训练，以提高特征提取的质量。

6.一种采用权利要求1～5中任一权利要求所述方法的基于同一特征空间的图文数据融合情感分类装置，其特征在于，包括：

图片特征提取模块，负责使用自动编码机提取多模态数据中图片的压缩特征表达；

文字特征提取模块，负责使用CNN-DCNN网络提取多模态数据中文字的压缩特征表达；

图文特征联合模块，负责将提取的图片特征和文本特征映射到同一个特征向量空间，得到图文整体特征；

分类模块，负责通过分类器对图文整体特征进行分类，得到情感分类结果。

7.根据权利要求6所述的装置，其特征在于，所述图文特征联合模块通过统一的损失函数将图片、文本的特征映射到同一个特征向量空间，并将图片特征与文本特征进行组合，形成成对的图文特征；所述分类模块采用的分类器为随机森林分类器。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所，未经中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910097903.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于监督学习的台区用户识别及判别方法
下一篇：一种职位构图和自动聚类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于同一特征空间的图文数据融合情感分类方法和装置有效

专利文献下载