[发明专利]一种基于深度学习的民航微博安保舆情情感分析方法在审
申请号: | 201810290094.9 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108536801A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 韩萍;孙佳慧;方澄;贾云飞 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度学习的民航微博安保舆情情感分析方法。其包括如下步骤:对微博数据集中的文本内容进行预处理和分词;训练词向量;构建组合的深度学习网络C‑LSTM,训练基于该网络的分类器,对微博文本中是否含有民航安保威胁内容进行分类;针对有威胁的微博文本细化打分,评定其威胁度等级。本发明先利用基于深度学习的方法训练分类器,粗略过滤出有关民航的主观负面言论,去除客观言论如新闻、陈述事实的微博;再利用民航舆情关键词语和规则计算并划分威胁度等级。解决了基于词语典和规则的方法中因含有民航舆情关键词语的客观言论被判为高威胁度等级的问题,具有适用性更强、准确率更高的特点。 | ||
搜索关键词: | 微博 民航 安保 威胁 关键词语 情感分析 预处理 文本 学习 训练分类器 数据集中 文本内容 词向量 分类器 再利用 准确率 分词 构建 细化 去除 过滤 网络 评定 主观 分类 | ||
【主权项】:
1.一种基于深度学习的民航微博安保舆情情感分析方法,其特征在于:其包括按顺序进行的下列步骤:(1)从网上大量的文本中筛选出与民航安保舆情相关的关键词,由这些关键词和对应的威胁强度值构成关键词库;(2)将根据民航安保舆情关键词筛选出的微博文本以及对应的标签作为训练集,对训练集中的微博文本进行预处理操作和分词处理;每一微博文本由至少一个微博子句构成,标签分为威胁和无威胁两种;(3)对由步骤(2)得到的分词后的微博文本进行词向量训练,得到词向量模型;(4)构建卷积神经网络和长短时记忆网络的组合深度学习网络,并在组合深度学习网络后加入全连接层以及softmax层,共同构成组合深度学习分类模型;(5)将训练集中分词后的微博文本输入到步骤(3)得到的词向量模型中,将微博文本向量化;(6)将步骤(5)中获得的向量化后的微博文本以及对应的标签输入到组合深度学习模型中,训练组合深度学习分类模型的组合深度学习网络中的有无威胁文本分类器并保存(7)将待分析的微博文本按照步骤(2)的方法进行预处理操作和分词处理后,通过步骤(3)获得的词向量模型进行微博文本向量化,然后输入到上述步骤(6)获得的有无威胁分类器中进行分类,最后针对判定为有威胁的微博文本进一步根据情感词典和规则计算威胁度分值;(8)根据上述威胁度分值判定威胁度等级。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810290094.9/,转载请声明来源钻瓜专利网。