[发明专利]一种用于中文微博情感分类的特定情感词典的生成方法有效

专利信息
申请号: 201811145088.0 申请日: 2018-09-29
公开(公告)号: CN109376239B 公开(公告)日: 2021-07-30
发明(设计)人: 赵传君;王素格;李德玉 申请(专利权)人: 山西大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36;G06F40/211;G06F40/253;G06F40/289;G06F40/242
代理公司: 北京中南长风知识产权代理事务所(普通合伙) 11674 代理人: 郑海
地址: 030006 山西省*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 中文 情感 分类 特定 词典 生成 方法
【说明书】:

发明公开了一种用于中文微博情感分类的特定情感词典的生成方法,首先对微博语料进行预处理,选取多个情感单元,接着使用其构建情感传播图,并计算其的标准中心度,根据标准中心度选取种子情感单元,并通过通用情感词典和人工标注对种子情感单元进行情感标签标注。最后,通过情感传播算法完成带标签的种子情感单元集合向不带标签的情感单元的情感传播,并获取每个情感单元中每个情感词的情感分,得到包含显式情感特征和隐式情感特征的微博特定情感词典,进而根据微博特定情感词典对微博语料的情感进行分类。与同类代表性方法相比,其总体计算准确度更高,具有更高的稳定性,可以有效地构建领域特定的情感词典,准确抽取显式和隐式情感特征。

技术领域

本发明涉及计算机社会媒体文本情感分析领域,提出了一种用于中文微博情感分类的特定情感词典的生成方法。

背景技术

情感词典的构建是情感分析任务的一个基本和重要的方面。其中,词或短语是表达积极或消极情感的基本元素。目前,微博已成为互联网上一种时尚的交流方式。个人用户可以通过新浪微博等媒介自由、方便、即时地表达他们对产品和公共事件的看法。由于微博的长度特别短和丰富的词汇量,微博表示的向量空间模型非常稀疏。因此,词典方法更适合于微博情感分析。但不同领域使用的情感词汇是不同的,在不同的领域中出现的同一个词可能表达不同的观点,这就导致了情感表达的多样性和情感词汇的语义多变性。由于词或短语的情感往往取决于一个特定的领域,并且,在一个特定领域中,使用通用情感词典对情感词汇的人工标注是耗时耗力的,因此,通用情感词典并不能很好的对特定领域的情感进行分类,不能满足特定领域情感分类的需求。

现有技术中提出了诸如基于语言规则的方法、基于语料库的方法和基于词典的方法来自动地构建领域特定的情感词典。但是,由于微博的语法的表达形式多样,用户在组织微博时没有按照语法规则,因此,基于语言规则的方法并不能适微博所有情况;基于语料库的方法又严重依赖于语料库的规模,基于词典的方法与通用的情感词典的质量密切相关。因此,上述三种方法均不适应于微博特定领域情感词典的构建。

另外,已有的情感分析研究往往关注于类似“美好”、“厌恶”和“喜欢”等显式的情感特征(Explicit Sentiment Features)。这些情感特征的一个明显要素是有明显的情感指示。这些直接在实体或者方面上表达情感的情感词、短语和习语被称作显式情感特征。事实上,许多用户使用语言修辞或事实的语句来表达含蓄间接地情感。隐式情感特征(Implicit Sentiment Features)通常是指表达正面或负面情感而不具有明显情感指示词的特征。这些特征往往陈述了一个事实或者间接地表达了情感。包含了隐式情感特征“油老虎”、“洪荒之力”、“水军”和“五毛特效”的四个微博如图3所示。因为没有任何的情感指示,隐式情感特征的识别一直是一个有挑战性的问题。

发明内容

本发明旨在通过提取显性和隐性的情感特征来构建微博特定的情感词典,并根据情感特征的情感极性(正面、负面和中性)对微博进行情感分类。

为达到上述目的,针对微博特定情感词汇的构建和所提到的隐式情感特征特点,本发明提出了一种用于中文微博情感分类的特定情感词典的生成方法,包括以下步骤:

S1,对微博语料D={d1,d2,…dl}进行预处理,通过词法分析和句法分析抽取多个情感单元Ti,并将多个所述情感单元Ti作为情感单元集合T={T1,T2,…Tn},其中,i,n为正整数,1≤i≤n,定义Ti=(N,D,E,P),N为负面指示词,D为程度副词,E为评价词,P为情感极性;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811145088.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top