[发明专利]一种基于残差注意力的方面级情感分析方法有效
申请号: | 202010664010.0 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111814450B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 熊庆宇;吴超;高旻;王凯歌;易华玲;杨正益;文俊浩;张致远;吴丹 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/205;G06F40/279;G06N3/0464;G06N3/0455;G06N3/047;G06N3/048 |
代理公司: | 重庆西南华渝专利代理有限公司 50270 | 代理人: | 郭桂林 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 方面 情感 分析 方法 | ||
本发明公开了一种基于残差注意力的方面级情感分析方法,方法包括以下步骤:对输入的语句和所有的方面目标信息进行编码,得到文本编码;对待预测的方面目标在文本中的位置信息进行编码,并与得到的文本编码进行融合;对待预测的方面目标信息和融入位置编码的文本编码进行处理;将得到的编码与融入位置信息的文本编码进行结合;提取其余方面目标中的信息,与得到的文本编码进行交互处理,然后从得到的文本编码中过滤;对过滤后的文本编码进行处理,得到最终结果。本发明提出了一种将残差网络引入到注意力机制的方法,能够显著的提高文本方面级别情感分析的准确率,并且模型具有较好的鲁棒性和通用性,分析的效率也有了一定的提升。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于残差注意力的方面级情感分析方法。
背景技术
随着互联网的飞速发展,网络已然成为生活中必不可少的一部分。根据中国互联网络信息中心于2019年8月发布的《中国互联网络发展状况统计报告》的数据显示,截至2019年6月,我国网民规模为8.54亿,互联网普及率达61.2%;我国手机网民规模达8.47亿,使用手机上网的比例达99.1%。网络用户也越来越习惯于在各类网站上发表自己的意见和观点,逐渐从过去单纯的信息获取者变成网络内容的主要制造者。互联网数据中心(IDC)在一份报告中预测道:截止到2020年,数据量将会增长至400亿TB(4*1022字节),即比2010年初增长了50倍;其中包含了大量来源于社交网络、新闻报道和电商平台等领域的文本数据,使得文本信息挖掘的相关研究颇受关注。作为文本挖掘中一个重要研究方向为情感分析,其在对发布者所表述的情感进行判别方面具有关键作用。
目前,方面级的情感分析方法大致有两类,一类是基于规则和情感词典的方法,另一类则是基于神经网络的方法。
其中,基于规则和情感词典的方法主要是利用人为构建的情感词典和语义规则来提取文本中各方面目标所对应的情感词,然后对情感词典中情感词对应的分值进行统计,得出方面情感的最终得分。例如专利CN111027322A公开了一种面向财经新闻数据的细粒度情感分析方法,利用现有的实体识别及提取方法,获取到该篇新闻的所有上市公司实体集合,然后利用情感词典对上市公司实体集合中的每个实体进行情感分析和计算,得到每篇文章中每个上市公司的情感极性;这种分析方法需要耗费大量的成本去构建准确且全面的情感词典,并且要定义复杂的语义语法规则,如否定词、程度副词等,并且这种方法只能面向特定的领域,如果要应用到其他的领域中,则需要构建不同的情感词典和规则,迁移能力差且情感分析效果并不明显。
而基于神经网络的方法主要使用各类改进的神经网络模型对文本进行分析建模,而后在语料库上训练模型,最后利用训练好的模型对待处理的文本进行分析。例如专利CN110046353A公开了一种基于多语言层次机制的方面级情感分析方法,首先将输入文本转化为向量表示,然后获取输入文本中各个句子之间的时序关系,同时获取方面词在单个句子中的局部特征和在整个句子中的长距离依赖关系,然后基于分类特征来判别输入文本中不同方面的情感极性,最后获得方面词的情感信息;这种方法没有很好的处理方面词在文中所处的位置信息以及其他方面词对待预测方面词产生的情感干扰。
因此,本领域亟待一种能够在方面级情感分析过程中过滤掉其他方面目标对应的情感信息的方面级情感分析方法。
发明内容
本发明的目的是提供一种在方面级情感分析过程中能够过滤掉其他方面目标对应的情感信息,可以很好的对文本中方面目标的情感进行建模,减少其他方面情感产生的干扰,从而高效且准确的对文本的方面级情感进行分析的基于残差注意力的方面级情感分析方法。
一种基于残差注意力的方面级情感分析方法,所述方面级情感分析方法包括以下步骤:
S1:对输入的文本和所有的方面目标信息进行编码,将文本和所有的方面目标信息转变成张量形式,得到文本编码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010664010.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种配电柜用维修装置
- 下一篇:一种鞋内重点气味物质确定方法