[发明专利]基于表情分析和深度学习的社交网络情感分析方法在审

申请号：	201611035151.6	申请日：	2016-11-17
公开（公告）号：	CN106598942A	公开（公告）日：	2017-04-26
发明（设计）人：	金志刚;胡博宏;罗咏梅	申请（专利权）人：	天津大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/30;G06Q50/00
代理公司：	天津市北洋有限责任专利代理事务所12201	代理人：	程毓英
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于表情分析深度学习社交网络情感方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明是一种基于表情分析和深度学习的社交网络情感分析方法。

背景技术

随着互联网的飞速发展，越来越多的用户喜欢在网络上发布自己的观点、分享个人的生活状态，同时加强与朋友的沟通交流，社交媒体也因此发展迅猛。微博，作为一个基于用户关系信息分享、传播以及获取的平台，改变了传统网络媒体交流方式，开创了一个新的社交媒体互动模式，给用户提供更为丰富的信息内容和便捷的沟通方式，迅速成为了最受欢迎的社交网络媒体。

在微博平台中，用户通过发表个人对社会热点事件的看法、某一产品的购物体验等等，来表达自己的情感，形成了海量的话题文本信息。充分处理分析这些文本信息具有重要的社会价值、商业价值以及用户价值。因此，如何提高微博情感分析的精度，使微博情感分析发挥更大的价值是一个充满意义的工作。

发明内容

本发明针对微博情感分析问题，设计了一种将表情分析与深度学习模型结合的具体情感分析方法，进而改善情感分析效果。技术效果如下：

一种基于表情分析和深度学习的社交网络情感分析方法，包括下列步骤：

1)文本预处理：过滤无用字符，并提取出微博文本中的表情字符作为该微博对应的表情信息。

2)数值化特征：将1)中预处理后的微博文本转换为数值向量T，同时，1)中所得的表情信息也转换成该表情对应的数值ID，然后将文本向量T与表情ID合并，形成新的数值向量V。

3)特征训练：将数值向量V作为深度学习模型的输入，进行特征训练，设输出的特征向量为F。

4)计算类别：对特征向量F进行Softmax回归，计算出该微博的情感类别概率分布，进而获得情感类别。

5)模型微调：将4)所得的情感类别与该微博实际所属的情感类别比较，并通过反向传播算法对模型进行微调，获得训练完成的模型。

基于表情分析和深度学习的社交网络情感分析方法，将深度学习应用至文本情感分析问题中，提高模型的精度进而获得更准确的情感分析效果。此外，本方法还考虑到微博平台为用户提高了丰富的默认表情，同时表情字符在微博中的使用也越来越频繁，逐渐成为用户表达情感的重要手段。因此，本方法并不像传统方法在分析文本时将表情字符作为无用信息过滤，而是提取表情字符，使其作为模型训练时的输入，进而获得更好的情感分析效果。有益效果如下：

1.利用深度学习模型的抽象特征提取能力学习文本的抽象特征，进而提高情感分析的精度；

2.通过在文本预处理阶段提取(而不是过滤)表情字符，并将表情字符作为后续深度学习模型的输入，为情感分析提供多维度的信息，进而提高情感分析精度。

附图说明

图1本方法的基本训练步骤

图2本方法的基本使用步骤

具体实施方式

下面结合附图对实施方式进行说明。

本方法提出的情感分析方法重点在于其模型的训练过程，该过程如图1所示，以下详细说明：

1)文本预处理：过滤无用字符，例如“转发微博”等；同时，提取出微博文本中的表情字符作为该微博对应的表情信息，由于该表情字符由微博平台提供，因此可根据其规律提取。

2)数值化特征：将1)中预处理后的微博文本通过word2vec工具转换为数值向量T，同时，1)中所得的表情信息也转换成该表情对应的数值ID，然后将文本向量T与表情ID合并，形成新的数值向量V。

3)特征训练：将数值向量V作为深度学习模型的输入，进行特征训练，设输出的特征向量为F。

4)计算类别：对特征向量F进行Softmax回归，计算出该微博的情感类别概率分布，进而获得情感类别。