[发明专利]一种基于迁移学习的话题自适应的微博情感分析方法有效
申请号: | 201711257802.0 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108021660B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 童咏之;贾焰;周斌;杨树强;李爱平;黄九鸣;韩伟红;江荣;全拥;邓璐;刘强;张涛;胡玥;刘心 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于迁移学习的话题自适应的微博情感分析方法,其涉及社交媒体的数据挖掘技术领域,本发明方法首先结合临床心理学情绪检测表抽取情感词初始化情感分析向量,其次利用话题信息之间的语义相似度,话题域之间的领域特征分布相似度,以及实例之间的特征分布相似度,作为衡量外源域实例数据的可迁移性的度量标准。最后基于设计的方法,设计了在实际应用中使用该方法进行微博情感分析的策略。本发明能够解决特定话题下的微博数据情感标注缺失的问题,从而能够训练适应话题的情感分类器。这种方法不直接作用于分类模型本身,而是改变了训练样本的分布,进一步保证分类模型的独立同分布假设,从而使得情感分类模型能够取得更好的效果。 | ||
搜索关键词: | 一种 基于 迁移 学习 话题 自适应 情感 分析 方法 | ||
【主权项】:
1.一种基于迁移学习的话题自适应的微博情感分析方法,其特征在于,所述方法具体包括以下步骤:步骤1)构造一个大规模的同时具有话题标注和情感标注短文本语料库;步骤2)为所述语料库中的每一个话题及其话题背景信息的文本提取出其对应的分布式词向量特征,得到语料库中领域的特征;步骤3)对于特定话题下的微博情感分析任务,获取相应的待分析目标数据及其话题;通过话题词映射的词向量,按照特定方式获取标注语料特征库中相似话题下的实例数据,用这些数据训练得到一个分类模型;步骤4)所述步骤3)得到的分类模型具有话题相关性,加上现有的人工标注的微博数据训练得到的分类模型,得到最终的情感分类模型,输出对目标微博进的情感分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711257802.0/,转载请声明来源钻瓜专利网。