[发明专利]一种基于深度学习的民航微博安保舆情情感分析方法在审

专利信息
申请号: 201810290094.9 申请日: 2018-04-03
公开(公告)号: CN108536801A 公开(公告)日: 2018-09-14
发明(设计)人: 韩萍;孙佳慧;方澄;贾云飞 申请(专利权)人: 中国民航大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 天津才智专利商标代理有限公司 12108 代理人: 庞学欣
地址: 300300 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 微博 民航 安保 威胁 关键词语 情感分析 预处理 文本 学习 训练分类器 数据集中 文本内容 词向量 分类器 再利用 准确率 分词 构建 细化 去除 过滤 网络 评定 主观 分类
【说明书】:

一种基于深度学习的民航微博安保舆情情感分析方法。其包括如下步骤:对微博数据集中的文本内容进行预处理和分词;训练词向量;构建组合的深度学习网络C‑LSTM,训练基于该网络的分类器,对微博文本中是否含有民航安保威胁内容进行分类;针对有威胁的微博文本细化打分,评定其威胁度等级。本发明先利用基于深度学习的方法训练分类器,粗略过滤出有关民航的主观负面言论,去除客观言论如新闻、陈述事实的微博;再利用民航舆情关键词语和规则计算并划分威胁度等级。解决了基于词语典和规则的方法中因含有民航舆情关键词语的客观言论被判为高威胁度等级的问题,具有适用性更强、准确率更高的特点。

技术领域

本发明属于自然语言处理中的文本情感分析技术领域,尤其涉及一种基于深度学习的民航微博安保舆情情感分析方法。

背景技术

近年来,互联网上各类航班、机场炸弹威胁以及虚假恐怖信息呈高发势头。某些群众因对社会不满,往往在网上发布虚假威胁言论、谣言以及偏激语言等,面临恐怖威胁时,相比其它行业,民航业通常遭受更大伤害。微博因具有传播速度快、信息开放、影响广泛且发布者身份不易泄露的特点,是一种常见的恐怖信息传播途径。

情感分析是对带有情感色彩的文本进行处理、分析和应用的过程,它可以从文本数据中获取用户观点和情感倾向,有着重要的实用价值。情感分析的研究方法与技术手段通常与研究目标有关,总体来讲,现有研究成果多应用于产品领域或舆情分析领域,如公众对产品或事件的评价和意见。用于民航恐怖信息的情感分析方法极为少见,通过对与民航有关的微博文本进行情感分析,可以过滤出对民航安全有威胁的微博,从而锁定有犯罪倾向的重点用户。

目前,中文文本情感分析方法主要有基于语义理解和基于传统机器学习两类方法。但这两种方法应用于微博情感分析中主要存在以下问题:①基于语义理解的方法用构建基准褒贬词语库和定义表达规则的方法对语料进行模式匹配,对于表达方式复杂、不规则的微博文本处理上有很大的局限性。②基于传统机器学习的方法需要复杂的特征工程,耗费大量的人工成本。

发明内容

为了解决上述问题,本发明的目的在于提供一种基于深度学习的民航微博安保舆情情感分析方法。

为了达到上述目的,本发明提供的基于深度学习的民航安保舆情情感分析方法包括按顺序进行的下列步骤:

(1)从网上大量的文本中筛选出与民航安保舆情相关的关键词,由这些关键词和对应的威胁强度值构成关键词库;

(2)将根据民航安保舆情关键词筛选出的微博文本以及对应的标签作为训练集,对训练集中的微博文本进行预处理操作和分词处理;每一微博文本由至少一个微博子句构成,标签分为威胁和无威胁两种;

(3)对由步骤(2)得到的分词后的微博文本进行词向量训练,得到词向量模型;

(4)构建卷积神经网络和长短时记忆网络的组合深度学习网络,并在组合深度学习网络后加入全连接层以及softmax层,共同构成组合深度学习分类模型;

(5)将训练集中分词后的微博文本输入到步骤(3)得到的词向量模型中,将微博文本向量化;

(6)将步骤(5)中获得的向量化后的微博文本以及对应的标签输入到组合深度学习模型中,训练组合深度学习分类模型的组合深度学习网络中的有无威胁文本分类器并保存

(7)将待分析的微博文本按照步骤(2)的方法进行预处理操作和分词处理后,通过步骤(3)获得的词向量模型进行微博文本向量化,然后输入到上述步骤(6)获得的有无威胁分类器中进行分类,最后针对判定为有威胁的微博文本进一步根据情感词典和规则计算威胁度分值;

(8)根据上述威胁度分值判定威胁度等级。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810290094.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top