[发明专利]一种使用社交上下文特征的深度微博情感分析方法在审
申请号: | 201910446241.1 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110188200A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 杨静;邹晓梅;韩宏宇;张薇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/9536;G06F17/27;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 情感分析 上下文特征 上下文信息 预处理 文本信息 自然语言处理 采集 分类模型 记忆网络 连续分布 实数向量 文本情感 文本特征 用户信息 文本 学习 发布 分析 | ||
本发明属于自然语言处理领域,具体涉及一种使用社交上下文特征的深度微博情感分析方法。本发明方法包括以下步骤:1)采集微博数据并对其进行预处理。具体包括采集和预处理微博文本信息和发布微博的用户信息即社交上下文信息;2)使用一种深度学习方法对微博社交上下文信息进行表示,将每个微博表示成为连续分布的实数向量;3)建立一个基于长短期记忆网络的深度学习分类模型,结合微博文本特征和社交上下文特征对微博进行情感分析。本发明针对微博数据的特点,提取了微博文本之间的上下文信息,并对其进行表示,将其作为特征同文本信息一起进行微博文本情感分析,本发明方法能够提高微博情感分析的效果。
技术领域
本发明属于自然语言处理领域,具体涉及一种使用社交上下文特征的深度微博情感分析方法。
背景技术
情感分析又称意见挖掘,是指运用自动化的手段分析、处理、归纳和推理带主观色彩的文本的过程。随着Web2.0技术的发展,在线社交网络如新浪微博、Twitter等逐渐成为人们日常获取、传播信息和交流观点的平台。用户成为在线社交网络的中心,他们在社交网络平台上不受限制地发布大量带有对各种事件、话题有关观点看法的文本信息。这些用户生成的文本蕴含着巨大的价值,可以应用在突发事件发现、舆情控制等领域。情感分析作为一个自然语言处理领域的热门研究方向,可以为在线社交网络文本分析提供重要的技术手段。
社交网络中情感分析研究的一般方法是应用自2000年初开始研究的传统情感分析所使用的技术。然而,由于信息来源的演变,现有技术中可用的方法在这个充满挑战的社交网络环境中不能再有效地进行情感分析。事实上,社交网络情感分析除了传统情感分析和自然语言处理的众多问题外,还引入了更复杂的内容和新的信息来源,更复杂的内容包含短而噪音多的文本,性别,位置和年龄等元数据。
传统方法假设社交网络中的文本是独立同分布的,不符合在线社交网络数据的特征。在选择情感分类特征的时候,传统方法通常只选择微博中的文本特征,如单元组、双元组等,并没有考虑社交网络上提供的丰富的上下文信息。然而,这种假设并不适用于微博平台。微博平台是一种新型的社交媒体,除了基本的文本信息外,微博平台还提供了丰富的元数据,如用户资料,用户关系等。换句话说,由于元数据间存在发布、关注、喜欢等各种关系,微博数据之间也因此由微博平台提供的各种元数据等连接在一起,组成了一个关系多样、结构丰富的网络。这些元数据,通常称为微博文本的社交上下文信息。基于这个事实,仅使用文本内容作为分类特征对于微博情感分析是远远不够的。
发明内容
本发明的目的在于结合新涌现的社交网络的特征,提供一种不同于基于文本之间相互独立模型的新型的微博情感分析方法,即一种使用社交上下文特征的深度微博情感分析方法,该方法使用微博的社交上下文表示作为特征。
本发明的目的是这样实现的:
一种使用社交上下文特征的深度微博情感分析方法,包括以下步骤:
步骤1:采集微博数据并对其进行预处理,具体包括采集和预处理微博文本信息和发布微博的用户即社交上下文信息;
步骤2:使用一种深度学习方法对微博社交上下文信息进行表示,将每个微博表示成为连续分布的实数向量;
步骤3:建立一个基于长短期记忆网络的深度学习分类模型,结合微博文本特征和社交上下文特征对微博进行情感分析。
步骤2中对社交上下文关系图G(V,E)进行表示具体包括以下步骤:
步骤2.1:对社交上下文网络G(V,E)中的局部信息进行表示:
其中vi和vj是节点νi和νj的向量表示,wij表示节点νi和νj之间的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446241.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于智能语音交互的文本分类方法
- 下一篇:一种信息匹配方法及设备