[发明专利]一种跨领域情感分类方法和相关装置有效

专利信息
申请号: 201811406037.9 申请日: 2018-11-23
公开(公告)号: CN109492229B 公开(公告)日: 2020-10-27
发明(设计)人: 陈恩红;刘淇;张凯;赵洪科;章和夫 申请(专利权)人: 中国科学技术大学
主分类号: G06F40/30 分类号: G06F40/30;G06F16/35
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王宝筠
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 领域 情感 分类 方法 相关 装置
【说明书】:

发明提供一种跨领域情感分类方法和相关装置。方法包括:获取目标评论文本数据,并提取目标评论文本数据中的Aspect信息;依据目标评论文本数据和Aspect信息,获得评论单词序列和Aspect单词序列;将评论单词序列和Aspect单词序列输入至预先训练好的模型中;所述模型是根据评论文本数据和与评论文本数据对应的Aspect信息,使用交互式注意力网络进行建模,并通过对有标签的评论文本数据和无标签的评论文本数据进行训练得到的,所述模型具备域分类的能力和情感分类的能力;获取模型输出的用于表示所述目标评论文本数据的情感类别的结果。本发明能够提高跨领域情感分类的准确性。

技术领域

本发明涉及机器学习和文本数据挖掘技术领域,尤其涉及一种跨领域情感分类方法和相关装置。

背景技术

情感分析或意见挖掘是针对人们对诸如产品、服务、组织等实体所表达的观点、情绪、态度的挖掘与评估。该领域的发展和快速起步得益于网络上的社交媒体,例如产品评论、短文本描述等。近年来,情感分析已经成长为自然语言处理中最活跃的研究领域之一,在数据挖掘、Web挖掘、文本挖掘和信息检索方面有着广泛的研究。

以产品为例,对应该产品的评论信息会出现在网络上的公共论坛中,但是互联网中多数的评论是没有标签的,这就使得传统有监督的机器学习方法无法很好地被运用。为了解决这种大数据与少标签之间的矛盾,跨领域的情感分类被提出并被广泛研究。

跨领域的情感分类主要是针对某个领域(目标域)内缺少有标签的数据的情况,由此引入一个有足够标签信息的领域(源域)来训练模型,通过领域之间的知识学习与迁移,从而能够有效地将无标签的目标域中的数据进行情感的正负分类。

目前,关于跨领域情感分类的方法主要包括以下两种方法:

1)基于传统机器学习方法的共享特征手动提取分析。

基于传统机器学习的工作旨在挖掘出领域之间的关系,并将这种关系形式化为共享特征。在文本领域,为了使其更具有解释性,研究者通常将这种共享特征称之为领域间共有的情感词汇。经过先前工作的分析与研究,验证了不同领域之间共享的一些知识确实能够帮助提高跨领域情感迁移的效果。

2)基于神经网络的共享特征自动识别及提取分析。

基于神经网络的跨领域情感分类结合了传统方法中常用的特征提取方式,同时发挥深度学习的性能,利用不同神经网络结构(如记忆网络、对抗网络)自动提取出领域之间的共享特征。这种方法不仅能够更加充分地提取出不同领域之间的共享特征,还能够增强领域间情感迁移的解释性。

然而,本发明的申请人发现,虽然上述两种方法都能够有效提取出不同领域之间的共享特征,完成跨领域的情感迁移,但是上述两种方法都没有充分考虑到文本具有的一些其他方面特征,该其他方面的特征对于情感分类的结果有较大影响,从而可能导致情感分类结果不准确的问题。例如:对某件产品的评论中可能包含对该产品的多个方面的描述,而产品的不同方面对产品的影响必然是不同的,若将这些不同方面的特征赋予相同的权重,则会大大降低对该产品评论所包含情感倾向的判断准确度。同理,对于不同领域来说,必然存在一些相似的方面信息(例如:不同类别的商品评论中会存在对于其“外观”的评价),而这些方面信息因领域不同也必然有着不同的影响。

发明内容

有鉴于此,本发明提供一种跨领域情感分类方法和相关装置,以提高跨领域情感分类方法的准确性。技术方案如下:

基于本发明的一方面,本发明提供一种跨领域情感分类方法,包括:

获取目标评论文本数据,并提取所述目标评论文本数据中的方面Aspect信息;其中所述目标评论文本数据无标签;

依据所述目标评论文本数据和所述Aspect信息,获得所述目标评论文本数据对应的评论单词序列和Aspect单词序列;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811406037.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top