[发明专利]一种基于社会媒体的宏观经济领域情感分析方法及系统在审
申请号: | 201711248804.3 | 申请日: | 2017-12-01 |
公开(公告)号: | CN107885883A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 付博 | 申请(专利权)人: | 北京国信宏数科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京恒都律师事务所11395 | 代理人: | 王清亮 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社会 媒体 宏观经济 领域 情感 分析 方法 系统 | ||
技术领域
本申请涉及数据分析领域,特别地,涉及一种基于社会媒体的宏观经济领域情感分析方法及系统。
背景技术
随着网络媒体技术的发展和普及,Twitter、新浪微博等社会媒体成为了最普遍的信息发布、传播和共享的工具。用户在这些工具生成的数据中包含有大量的带有情感色彩的信息,这些信息表达了人们各种情感色彩和情感倾向,如“喜”、“怒”、“哀”、“愁”、“惊”等情感的表达,以及“积极”、“消极”等态度的表达。通过浏览统计这些带有主观色彩的信息,可以了解大众舆论对于某一事件或国家政策的看法。例如,互联网(如微博、论坛等)上发布了大量的国家政策、股票行情等有价值的新闻信息,用户通过对这些新闻、事件、政策等发表不同的言论,如针对北京医改政策,有网民表示对药费下降的事情持正面情绪,也有网民表示对挂号费大幅提高的事情持负面情绪。因此,利用互联网数据进行情感分析用以辅助政府决策成为该领域研究的热点问题。
情感分析是指从无结构的文本中自动地分析、抽取和整理带有主观色彩的文本。情感分析的任务繁多,最初的情感分析研究主要是对带有情感色彩的词语的分析,简称情感词。情感词是带有褒义或者贬义色彩的词语,是决定情感类型的重要的特征词语。如“全面”是带有褒义色彩的词语,而“严峻”是带有贬义色彩的词语。随着互联网上大量的带有情感色彩的文本出现,研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句子的研究,继而为舆情监控与信息预测服务。按照任务的不同,情感分析包含情感分类、情感元素抽取、情感词典构建、情感摘要、情感检索等。
情感分析在众多应用领域中都有重要的意义。例如情感分析搭建了大众与政府沟通的桥梁,改变了以往需要通过问卷调查等了解民情的传统方式。通过对社交媒体文本的情感分析,政府部门可以方便地收集到广大民众对政策法规的态度,为改进政府工作和预防公众不满情绪提供决策依据。此外,情感分析还可以促进人工智能等相关领域的发展,甚至可为社会学、传播学、语言学、管理学等社会科学提供实证基础。
如下表1所示,示出了微博中的情感句和非情感句的实例:
表1微博情感句与非情感句实例
目前,现有技术中情感分析主要包含两类方法,分别是基于情感词典匹配的文本情感分类和基于大规模数据的机器学习的方法。
基于情感词典匹配的方法是基于已构建的情感词典完成对某类情感句的识别和抽取。这种方法虽然高效快速,但其依赖于具体领域,可移植性差。
基于机器学习的方法通常把事件抽取任务看作分类问题,主要的问题则是在分类器的构建以及特征的选择和发现上。相对而言,这种方法较为客观,不需要太多的人工模板的指定和领域相关知识的依赖。因此,目前的情感分析研究大多是采用基于机器学习的方法,研究者的工作主要体现在特征选择和分类算法两个方面。但是此种研究算法仅适用于通用领域,不适用于特定领域。
发明内容
本申请提供一种基于社会媒体的宏观经济领域情感分析方法及系统,用于解决现有技术对于社会媒体数据分析不适用于特定领域,移植性差的问题。
本申请公开的一种基于社会媒体的宏观经济领域情感分析方法,其特征在于,所述方法包括:
通过数据模块抓取经济领域的社会媒体数据,并对所述社会媒体数据进行预处理;
通过分类特征模块定义社会媒体数据的分类特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国信宏数科技有限公司,未经北京国信宏数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711248804.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有电灯调节功能的智能自行车
- 下一篇:一种新型自行车尾灯安装支架