[发明专利]面向微博“树洞”留言文本的情感分析方法在审

专利信息
申请号: 202110336845.8 申请日: 2021-03-29
公开(公告)号: CN113111148A 公开(公告)日: 2021-07-13
发明(设计)人: 林绍福;景晓敏;黄智生 申请(专利权)人: 北京工业大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/9536;G06F40/289;G06K9/62;G06N3/04;G06N3/08;G06Q50/00
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 刘萍
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 树洞 留言 文本 情感 分析 方法
【说明书】:

面向微博“树洞”留言文本的情感分析方法属于自然语言处理技术领域。抑郁症患者于微博留言离世后,依然有微博留言信息不断聚集,从而形成微博“树洞”,一些人对生活失去希望,会选择在主人离去的页面倾吐情绪或自杀计划。针对这部分人群如何对其进行分析及监测救援是目前需要解决的问题。本发明包含:(1)提出一种结合BiLSTM和CNN的深度学习模型分析微博文本情感极性。(2)在原模型的基础上加入自注意力机制,通过注意力机制更好的表征文本词向量的序列特征。该方法满足了分析潜在抑郁人群情绪及监测的需求,对抑郁症识别起到了至关重要的作用。

技术领域

本发明属于自然语言处理技术领域,主要包括句法语义分析、信息提取和查询、文本挖掘、神经网络等重要分支。

背景技术

情感分析,也称为意见挖掘,可以从书面语言中分析出人们的情感、观点和态度。情感分析方法主要包括两种:基于规则和基于机器学习。基于规则的方法依赖于情感词典的构建,即将分词后的文档与情感词典的词进行匹配,并统计匹配成功的情感词数量。传统的机器学习算法具有良好的性能,前提是需要对文本做一定的处理,即传统的机器学习算法对特征有一定的要求。因此,情感分析的表现很大程度上依赖于文本特征的选择,这一过程需要大量的人力物力。深度学习通过构造深层次的网络结构来学习数据特征和数据分布,从而可以在文本中自动去学习特征,这相对于传统机器学习,会节约很多时间。

数据显示,15%的抑郁症患者死于自杀,50%以上的抑郁症患者曾想过自杀。全球范围内,抑郁症已成为15-29岁群体的第二大死亡原因。部分抑郁症患者自杀或其他原因离世后,依然有微博留言信息不断聚集,从而形成微博“树洞”,微博用户在“树洞”中诉说自己的心事以及自杀意图,更有甚者,很多用户集聚一起相约自杀。通过对留言内容的文本提取分析,对其进行情感分析及监测救援至关重要。因此,面向微博“树洞”留言文本的情感分析方法是具有实际意义的。

发明内容

本发明的目的在于针对“树洞”留言文本特性提出一个面向微博“树洞”留言文本的情感分析方法,即以“树洞”微博为实验语料,综合分析抑郁症微博特性,结合场景需要,本方法在CNN模型的基础上加入了对文本语义特征提取具有较好效果的加有词注意力机制的BiLSTM模型,提出基于词注意力机制的BiLSTM和CNN模型的集成模型即Att-BiLSTM-CNN,进行情感极性判断。满足对“树洞”人群的情感分析及监测救援的需要。

附图说明:

图1是Att-BiLSTM-CNN总体框架图

图2是Att-BiLSTM-CNN模型图

图3是BiLSTM模型图

图4是BiLSTM网络层结构图

图5是模型训练参数设置图

具体实施方式:

本发明采用基于注意力机制的BiLSTM-CNN模型进行情感分析,总体框架图及模型图如图1、2所示,其技术方案一共分为四步:

(1)数据预处理:利用网络爬虫爬取新浪微博中“树洞”留言内容,将数据存入excel中,并对数据进行去重、去无用数据清洗操作;利用python中jieba分词对文本内容进行分词处理,并去除停用词,经word2vec方法将文本语料训练成词向量表示。

(2)将步骤(1)中词向量作为BiLSTM模型的输入,通过BiLSTM提取上下文全局特征。

作为传统的序列模型,LSTM通常只在一个方向上读取文本。在实际文本处理中,文本具有前后序列特征相关性,因此,本方法采用双向长短期记忆模型即BiLSTM,包含两个LSTM层,分别训练前向和后向序列,既能保留LSTM解决长期依赖的优点,又可以兼顾到上下文信息,有效处理序列问题。BiLSTM模型及网络层结构如图3、4所示。

具体算法公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110336845.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code