[发明专利]基于表情分析和深度学习的社交网络情感分析方法在审
申请号: | 201611035151.6 | 申请日: | 2016-11-17 |
公开(公告)号: | CN106598942A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 金志刚;胡博宏;罗咏梅 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06Q50/00 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 表情 分析 深度 学习 社交 网络 情感 方法 | ||
技术领域
本发明是一种基于表情分析和深度学习的社交网络情感分析方法。
背景技术
随着互联网的飞速发展,越来越多的用户喜欢在网络上发布自己的观点、分享个人的生活状态,同时加强与朋友的沟通交流,社交媒体也因此发展迅猛。微博,作为一个基于用户关系信息分享、传播以及获取的平台,改变了传统网络媒体交流方式,开创了一个新的社交媒体互动模式,给用户提供更为丰富的信息内容和便捷的沟通方式,迅速成为了最受欢迎的社交网络媒体。
在微博平台中,用户通过发表个人对社会热点事件的看法、某一产品的购物体验等等,来表达自己的情感,形成了海量的话题文本信息。充分处理分析这些文本信息具有重要的社会价值、商业价值以及用户价值。因此,如何提高微博情感分析的精度,使微博情感分析发挥更大的价值是一个充满意义的工作。
发明内容
本发明针对微博情感分析问题,设计了一种将表情分析与深度学习模型结合的具体情感分析方法,进而改善情感分析效果。技术效果如下:
一种基于表情分析和深度学习的社交网络情感分析方法,包括下列步骤:
1)文本预处理:过滤无用字符,并提取出微博文本中的表情字符作为该微博对应的表情信息。
2)数值化特征:将1)中预处理后的微博文本转换为数值向量T,同时,1)中所得的表情信息也转换成该表情对应的数值ID,然后将文本向量T与表情ID合并,形成新的数值向量V。
3)特征训练:将数值向量V作为深度学习模型的输入,进行特征训练,设输出的特征向量为F。
4)计算类别:对特征向量F进行Softmax回归,计算出该微博的情感类别概率分布,进而获得情感类别。
5)模型微调:将4)所得的情感类别与该微博实际所属的情感类别比较,并通过反向传播算法对模型进行微调,获得训练完成的模型。
基于表情分析和深度学习的社交网络情感分析方法,将深度学习应用至文本情感分析问题中,提高模型的精度进而获得更准确的情感分析效果。此外,本方法还考虑到微博平台为用户提高了丰富的默认表情,同时表情字符在微博中的使用也越来越频繁,逐渐成为用户表达情感的重要手段。因此,本方法并不像传统方法在分析文本时将表情字符作为无用信息过滤,而是提取表情字符,使其作为模型训练时的输入,进而获得更好的情感分析效果。有益效果如下:
1.利用深度学习模型的抽象特征提取能力学习文本的抽象特征,进而提高情感分析的精度;
2.通过在文本预处理阶段提取(而不是过滤)表情字符,并将表情字符作为后续深度学习模型的输入,为情感分析提供多维度的信息,进而提高情感分析精度。
附图说明
图1本方法的基本训练步骤
图2本方法的基本使用步骤
具体实施方式
下面结合附图对实施方式进行说明。
本方法提出的情感分析方法重点在于其模型的训练过程,该过程如图1所示,以下详细说明:
1)文本预处理:过滤无用字符,例如“转发微博”等;同时,提取出微博文本中的表情字符作为该微博对应的表情信息,由于该表情字符由微博平台提供,因此可根据其规律提取。
2)数值化特征:将1)中预处理后的微博文本通过word2vec工具转换为数值向量T,同时,1)中所得的表情信息也转换成该表情对应的数值ID,然后将文本向量T与表情ID合并,形成新的数值向量V。
3)特征训练:将数值向量V作为深度学习模型的输入,进行特征训练,设输出的特征向量为F。
4)计算类别:对特征向量F进行Softmax回归,计算出该微博的情感类别概率分布,进而获得情感类别。
5)模型微调:将4)所得的情感类别与该微博实际所属的情感类别比较,并通过反向传播算法对模型进行微调,最终获得训练完成的模型。
模型经过大量的训练数据训练完成后,再次输入微博文本即可获得该文本对应的情感类别结果,具体步骤如图2所示,其中“计算特征”与“计算情感类别结果”与训练过程中的“特征训练”与“计算类别”对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611035151.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全局优化文本关键词质量的算法
- 下一篇:智能藏文自动分词系统