[发明专利]基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法有效

专利信息
申请号: 202110325886.7 申请日: 2021-03-26
公开(公告)号: CN112800184B 公开(公告)日: 2021-08-06
发明(设计)人: 陈沁蕙;赵慧;姚婉薇 申请(专利权)人: 华东师范大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/36;G06F40/242;G06N3/04;G06N3/08
代理公司: 上海德禾翰通律师事务所 31319 代理人: 夏思秋
地址: 200241 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 target aspect opinion 联合 抽取 文本 评论 情感 分析 方法
【说明书】:

发明提供一种基于Target‑Aspect‑Opinion联合抽取的短文本评论情感分析方法。本发明首先对短文本数据集进行预处理,筛选有效数据,然后对数据集进行预标注工作,然后构建基于Target‑Aspect‑Opinion联合抽取的情感分析模型。本发明提出的联合抽取模型,解决了现有模型中单独抽取Target或Aspect等带来的识别不全面问题,以及通过构建TargetTaggers和Aspect‑OpinionTaggers,有效解决了目标词重叠问题。

技术领域

本发明涉及人工智能、深度学习技术领域,尤其涉及自然语言处理有关的研究和分析,具体涉及评论文本属性级别的情感分析,涉及一种基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法。

背景技术

微博、论坛、购物网站等平台为用户提供了信息交流的空间,由此产生了海量有价值的用户评论信息。如汽车领域的用户评论数据不仅可以帮助汽车生产商改进汽车产品设计及营销策略,而且可以为用户购买汽车提供决策依据和参考信息。因此,基于细粒度的情感分析对于不同用户皆具有重要意义。传统的方面级别情感分析问题包括基于主题的情感分析(Aspect Based SentimentAnalysis,ABSA)和基于目标的情感分析(Target BasedSentimentAnalysis,TBSA)。但是单独的基于主题(Aspect)或目标(Target)进行情感倾向预测时,无法全方面获取情感信息。同时,评论数据中的评价短语(Opinion)也是评价情感倾向的重要元素。因此,研究如何联合抽取Target、Aspect、Opinion的情感分析问题能够更全面获取情感信息。

传统解决TBSA和ABSA问题的方法,如BiLSTM、CRF和注意力机制等为此类问题的分析提供了极大的帮助。虽然现有研究能够很好地捕获情感句上下文的交互信息,以更好的获取属性级别的情感,而由于Target和Opinion抽取是信息抽取任务,Aspect和情感分析是多分类任务,现有情感分析方法无法全面考虑到同时抽取Target-Aspect-Opinion三类信息带来的任务不一致问题。同时现有研究无法解决目标词重叠问题,即针对不同情感句中,相同Target和Opinion对应不同Aspect的情况。

发明内容

为解决现有技术中存在的上述问题,本发明提供了一种基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法,包括以下步骤:

步骤A:获取公开的评论文本数据,形成原始数据集C;

步骤B:文本预处理;

步骤C:为所述原始数据集C打上四元组标签;所述四元组标签为(评价对象Target,主题Aspect,评价短语Opinion,情感倾向Sentiment);

步骤D:将联合抽取四元组任务转化联合抽取三元组任务,并映射为实体关系联合抽取任务;

步骤E:构建基于Target-Aspect-Opinion的情感分析模型,并训练得到最终模型。

本发明步骤B包括:

步骤B1:探查分析数据集C中的过短文本,删除过短评论,即长度短于7个字的评论;

步骤B2:去除情感句中冗余的标点符号,冗余标点符号见图1;

步骤B3:统计数据集C中的领域短语及中英文不一致表达,基于官方领域词典,归一化为标准表达;

步骤B4:统计分析数据集C中的错别字表达,归一化为正确表达。

本发明步骤C中为数据标注阶段,统一对经过步骤B预处理之后的数据集C进行四元组标注。步骤C标注过程包括:

步骤C1:基于情感句标注所有存在的Aspect和当前Aspect对应的Sentiment;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110325886.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top