[发明专利]一种用于中文微博情感分类的特定情感词典的生成方法有效
申请号: | 201811145088.0 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109376239B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 赵传君;王素格;李德玉 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/211;G06F40/253;G06F40/289;G06F40/242 |
代理公司: | 北京中南长风知识产权代理事务所(普通合伙) 11674 | 代理人: | 郑海 |
地址: | 030006 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于中文微博情感分类的特定情感词典的生成方法,首先对微博语料进行预处理,选取多个情感单元,接着使用其构建情感传播图,并计算其的标准中心度,根据标准中心度选取种子情感单元,并通过通用情感词典和人工标注对种子情感单元进行情感标签标注。最后,通过情感传播算法完成带标签的种子情感单元集合向不带标签的情感单元的情感传播,并获取每个情感单元中每个情感词的情感分,得到包含显式情感特征和隐式情感特征的微博特定情感词典,进而根据微博特定情感词典对微博语料的情感进行分类。与同类代表性方法相比,其总体计算准确度更高,具有更高的稳定性,可以有效地构建领域特定的情感词典,准确抽取显式和隐式情感特征。 | ||
搜索关键词: | 一种 用于 中文 情感 分类 特定 词典 生成 方法 | ||
【主权项】:
1.一种用于中文微博情感分类的特定情感词典生成方法,其特征在于,包括以下步骤:S1,对微博语料D={d1,d2,…dl}进行预处理,通过词法分析和句法分析抽取多个情感单元Ti,并将多个所述情感单元Ti作为情感单元集合T={T1,T2,…Tn},其中,i,n为正整数,1≤i≤n,定义Ti=(N,D,E,P),N为负面指示词,D为程度副词,E为评价词,P为情感极性;S2,基于所述情感单元集合T构建情感传播图G=(V,E,W),V是情感单元的集合,E是边的集合,W是情感单元之间的权重矩阵,计算所述情感单元Ti的标准中心度H(Ti),并根据所述标准中心度H(Ti)对多个所述情感单元Ti进行排序,选取前M个作为种子情感单元集合Ts,并使用通用情感词典和人工标注对所述种子情感单元进行情感标签标注,其中,M
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811145088.0/,转载请声明来源钻瓜专利网。