[发明专利]一种基于混杂特征计算的微博主题情感分析方法在审
申请号: | 201610020251.5 | 申请日: | 2016-01-13 |
公开(公告)号: | CN105701210A | 公开(公告)日: | 2016-06-22 |
发明(设计)人: | 黄发良;元昌安;何万莉;李超雄 | 申请(专利权)人: | 福建师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q50/00 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350117 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于混杂特征计算的微博主题情感分析方法,包括以下步骤:1、微博数据预处理:应用中文分词、英文词根化、表情符提取技术提取微博特征,并利用先验知识对微博特征的情感和主题进行初始赋值;2、算法参数初始化;3、利用吉布斯采样技术对多特征主题情感模型MfJST的参数的联合分布A和H进行估值;4、通过微博m中情感极性s出现的概率判断每条微博m的情感极性;通过对联合分布A进行关于微博情感变量s的边缘化来实现微博消息隐含主题的检测。该方法能够有效挖掘出隐藏于微博消息中的用户关注主题及其真实情感,应用于推特、新浪微博等各种社交媒体,可优化网络舆情监控、提高信息服务质量等。 | ||
搜索关键词: | 一种 基于 混杂 特征 计算 主题 情感 分析 方法 | ||
【主权项】:
一种基于混杂特征计算的微博主题情感分析方法,其特征在于,包括以下步骤:步骤1、微博数据预处理:应用中文分词、英文词根化、表情符提取技术提取微博特征,包括词语和表情符,并利用先验知识对微博特征的情感和主题进行初始赋值;步骤2、算法参数初始化:随机初始化联合分布A(m,s,t)、B(s,t,w)、Z(s,t,e)和H(m,s),分布A的超参数α,分布B的超参数β,分布H的超参数η和分布Z的超参数ζ,微博用户性格分布矩阵US,其中m、s、t、w和e分别表示微博消息变量、微博情感变量、微博主题变量、词语变量和表情符变量;步骤3、利用吉布斯采样技术对多特征主题情感模型MfJST的参数的联合分布A和H进行估值;步骤4、通过判断每条微博m的情感极性,表示微博m中情感极性s出现的概率:对于微博m,若,其中s1为积极情感,s2为消极情感,则判定微博m的情感极性为积极情感,反之为消极情感;通过对联合分布A进行关于微博情感变量s的边缘化来实现微博消息隐含主题的检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610020251.5/,转载请声明来源钻瓜专利网。