[发明专利]融合表情符号库和主题模型的方面观点褒贬态度挖掘方法在审
申请号: | 201811134055.6 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109284381A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 张士兵;张茜;张晓格 | 申请(专利权)人: | 南通大学;南通先进通信技术研究院有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/2458;G06F17/27 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 吴静安;吴扬帆 |
地址: | 226000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的融合表情符号库和主题模型的方面观点褒贬态度挖掘方法为:首先计算原创微博及评论中名词之间的相似度矩阵,利用谱聚类算法得到与原创微博提到的方面相关的显式方面集与隐式方面集;然后构建融合表情符号库和主题模型的方面观点褒贬态度挖掘模型,并进行参数估计;最后结合观点挖掘模型和显式、隐式方面集对微博评论进行褒贬态度分析,得到每条用户评论对原创微博内容的褒贬态度倾向。本发明将主题模型与表情符号库相融合应用到微博原创内容下用户评论的方面观点挖掘和褒贬态度分析,同时结合与原创微博方面相关的显式方面以及存在于评论中的隐式方面,以更好获取评论用户对原创微博的褒贬态度,提高对评论集整体的褒贬态度倾向的判断。 | ||
搜索关键词: | 微博 表情符号库 主题模型 挖掘 评论 显式 隐式 用户评论 融合 相似度矩阵 参数估计 聚类算法 融合应用 原创内容 构建 分析 | ||
【主权项】:
1.一种融合表情符号库和主题模型的方面观点褒贬态度挖掘方法,其特征在于包括如下步骤:步骤1)对原创微博内容及评论进行预处理,提取评论语句的当中的名词和名词短语作为该评论的方面,提取形容词及形容词短语、动词及动词短语作为基于方面的观点词语信息,计算原创微博及评论中的方面之间的相似度矩阵,通过谱聚类算法得到与原创微博方面相关的显式方面集与与原创微博方面不相关的隐式方面集;步骤2)构建融合表情符号库与主题模型的方面观点褒贬态度的挖掘模型MAOEC,通过MAOEC模型产生微博评论集,并用吉布斯采样方法进行参数估计,得到MAOEC模型的参数分布;步骤3)结合显式方面集、隐式方面集以及MAOEC模型的参数分布对微博评论进行褒贬态度分析,得到每条用户评论对原创微博内容的褒贬态度倾向。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学;南通先进通信技术研究院有限公司,未经南通大学;南通先进通信技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811134055.6/,转载请声明来源钻瓜专利网。