[发明专利]一种基于深度学习的民航微博安保舆情情感分析方法在审
申请号: | 201810290094.9 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108536801A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 韩萍;孙佳慧;方澄;贾云飞 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 民航 安保 威胁 关键词语 情感分析 预处理 文本 学习 训练分类器 数据集中 文本内容 词向量 分类器 再利用 准确率 分词 构建 细化 去除 过滤 网络 评定 主观 分类 | ||
1.一种基于深度学习的民航微博安保舆情情感分析方法,其特征在于:其包括按顺序进行的下列步骤:
(1)从网上大量的文本中筛选出与民航安保舆情相关的关键词,由这些关键词和对应的威胁强度值构成关键词库;
(2)将根据民航安保舆情关键词筛选出的微博文本以及对应的标签作为训练集,对训练集中的微博文本进行预处理操作和分词处理;每一微博文本由至少一个微博子句构成,标签分为威胁和无威胁两种;
(3)对由步骤(2)得到的分词后的微博文本进行词向量训练,得到词向量模型;
(4)构建卷积神经网络和长短时记忆网络的组合深度学习网络,并在组合深度学习网络后加入全连接层以及softmax层,共同构成组合深度学习分类模型;
(5)将训练集中分词后的微博文本输入到步骤(3)得到的词向量模型中,将微博文本向量化;
(6)将步骤(5)中获得的向量化后的微博文本以及对应的标签输入到组合深度学习模型中,训练组合深度学习分类模型的组合深度学习网络中的有无威胁文本分类器并保存
(7)将待分析的微博文本按照步骤(2)的方法进行预处理操作和分词处理后,通过步骤(3)获得的词向量模型进行微博文本向量化,然后输入到上述步骤(6)获得的有无威胁分类器中进行分类,最后针对判定为有威胁的微博文本进一步根据情感词典和规则计算威胁度分值;
(8)根据上述威胁度分值判定威胁度等级。
2.根据权利要求1所述的基于深度学习的民航微博舆情情感分析方法,其特征在于:在步骤(1)中,所述的关键词分为地点词语和行为词语两类;其中行为词语有两个属性,第一个属性为威胁强度值,用于衡量该词语对民航安保的威胁程度,度量标准分为1,3,5,7,9五种强度;第二个属性为词语类型,词语类型分为两类,一类为直接型,即只出现这一个词语就能判定为对民航有威胁;另一类为间接型,即必须与地点词语同时出现才能判定出是否对民航安保有威胁。
3.根据权利要求1所述的基于深度学习的民航微博舆情情感分析方法,其特征在于:在步骤(2)中,所述的对训练集中的微博文本进行预处理操作和分词处理的方法是:预处理操作包括去除微博文本中的网页链接、转发、回复微博时的用户昵称、特殊字符在内的噪声信息,保留无威胁微博文本中的话题标签,作为区分包含民航舆情关键词的微博文本是主观威胁言论还是新闻话题的重要特征;然后利用分词工具对上述预处理后的微博文本进行分词。
4.根据权利要求1所述的基于深度学习的民航微博舆情情感分析方法,其特征在于:在步骤(3)中,所述的词向量训练采用word2vec算法中的Skip_gram方法,保存用该方法训练得到的词向量模型。
5.根据权利要求1所述的基于深度学习的民航微博舆情情感分析方法,其特征在于:在步骤(4)中,构建卷积神经网络和长短时记忆网络的组合深度学习网络,并在组合深度学习网络后加入全连接层以及softmax层,共同构成组合深度学习分类模型的方法是:利用不同的卷积核与输入层中的句子矩阵进行卷积操作;将同一尺寸卷积核下的特征值按时间顺序拼接起来,作为长短时记忆网络的输入,通过长短时记忆网络进一步获取微博文本的上下文关系特征;全连接层经过非线性变换后得到标签的得分向量;当标签的得分向量经过softmax层后,会计算出分类概率,最终得到分类的类别。
6.根据权利要求1所述的基于深度学习的民航微博舆情情感分析方法,其特征在于:在步骤(5)中,所述的将微博文本向量化的方法是:在词向量模型中找到微博文本每个词语对应的词向量,然后将词向量拼接为句子矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810290094.9/1.html,转载请声明来源钻瓜专利网。