[发明专利]一种民航安保舆情情感分析方法有效
申请号: | 201611062208.1 | 申请日: | 2016-11-25 |
公开(公告)号: | CN106598944B | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 韩萍;李杉;贾云飞;牛勇钢 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/38;G06F16/36;G06F16/35 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 民航 安保 舆情 情感 分析 方法 | ||
一种民航舆情情感分析方法。其包括对互联网上包含民航安保舆情关键词的微博文本进行检索、预处理和分词操作;构建词典;对微博进行打分,得到该微博情感分值;根据情感分值对微博进行主客观判别,得到该微博对民航安全的威胁度分值;根据威胁度分值判定微博文本中的言论对民航安全的威胁度等级等步骤。本发明利用文本语义和微博表情符号相结合的方式来判定微博文本的情感得分,克服了词典和语义规则的局限性,提高了情感得分判断准确度。充分利用微博文本的特点,使威胁度等级判定更加合理。本发明不同于机器学习方法,不需要用大规模带标记数据进行训练,因此更适用于实时数据流处理。
技术领域
本发明属于自然语言处理中的文本情感分析技术领域,特别是涉及一种民航安保舆情情感分析方法。
背景技术
在信息急速膨胀的互联网时代,越来越多的用户倾向于通过互联网来分享自己的观点或体验,所以社交网络中存在着大量的带有主观情感色彩的短文本。新浪微博是为大众提供娱乐休闲生活服务的信息分享和交流平台,目前新浪微博的活跃用户数保持在2亿左右,其继承了传统论坛、博客等形式的优点,结合手机等移动终端,使信息能够实时快速发布和获取。微博集娱乐、社交、营销于一身,已经从满足人们“弱关系”的社交需求上逐渐演变成为大众化的舆论平台,成为一个最重要的实时信息源和一种影响力日益增强的网络舆论传播中心,越来越多机构及公众人物都通过微博来发布或传播信息。
情感分析是对带有情感色彩的文本进行处理、分析和应用的过程,是自然语言处理中较前沿的研究领域。它是结合现有诸多研究成果的一种具体应用,与作为新网络社交媒体的微博相结合,有着重要的实用价值。微博情感分析的主要目的就是从微博信息中识别主观信息,挖掘用户对产品、新闻、热点事件等评论信息所持有的观点和态度。
在民航领域,网络舆论高度自由化的同时带来了一些负面影响,例如发布虚假威胁言论、谣言、偏激语言等。通过对与民航相关的微博文本进行情感倾向性分析,可以过滤出对民航安全有威胁的微博,从而锁定有犯罪倾向的重点用户,及时推送给相关公安部门进行处理。除此之外,文本情感分析还有以下几个方面的应用:预测电影票房、股票走势、市场动态等。因此对于微博文本情感倾向性分析具有十分重要的意义。
目前,中文文本情感分析方法主要有基于语义理解和基于机器学习两类方法。但这两种方法应用于微博情感分析中主要存在以下问题:①基于语义理解的方法用构建基准褒贬词库和定义表达规则的方法对语料进行模式匹配,对于表达方式复杂、不规则的微博文本处理上有很大的局限性。②基于机器学习的方法受限于特征的选取和语料规模大小,且容易产生过拟合效应,不适用于实时的大批量文本处理。
发明内容
为了解决上述问题,本发明的目的在于提供一种民航安保舆情情感分析方法。
为了达到上述目的,本发明提供的民航安保舆情情感分析方法包括按顺序进行的下列步骤:
(1)对互联网上包含民航安保舆情关键词的微博文本进行检索、预处理和分词操作;
(2)构建用于微博文本语义分析所需的各类词典,构建方法分为选取现有词典和自主构造的方式;
(3)根据上述步骤(2)构建的词典,对上述经步骤(1)分词后的微博进行打分,得到该微博的情感分值;
(4)根据步骤(3)中得到的情感分值对微博进行主客观判别,用于过滤新闻报道在内的客观微博,保留带有主观性的微博,最终得到该微博对民航安全的威胁度分值;
(5)根据步骤(4)得到的威胁度分值判定微博文本中的言论对民航安全的威胁度等级,然后筛选出威胁度等级高的重点人员,并作为预警信息报送相关部门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611062208.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能藏文自动分词系统
- 下一篇:模板检验方法及装置