[发明专利]一种语句中方面类别及情感极性联合识别的方法及系统有效
申请号: | 202211258785.3 | 申请日: | 2022-10-14 |
公开(公告)号: | CN115329775B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 江岭;王思宇;黄鹏 | 申请(专利权)人: | 成都晓多科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279;G06N20/00 |
代理公司: | 成都市集智汇华知识产权代理事务所(普通合伙) 51237 | 代理人: | 李华 |
地址: | 610218 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语句 方面 类别 情感 极性 联合 识别 方法 系统 | ||
本发明公开了一种语句中方面类别及情感极性联合识别的方法及系统,该方法包括获得训练语句的双向隐状态;取当前时间步的隐状态;把训练语句的双向隐状态转换成训练语句方面类别数量的高阶表示向量,并通过训练语句的高阶表示向量预测训练语句仅包含一个方面类别的概率;获得聚合值,利用聚合值以及方面类别数量的高阶表示向量获得训练语句的若干混合特征;将混合特征输入到全连接层I和全连接层II预测当前步长的方面类别和情感极性;对模型进行优化;将需要识别的目标语句输入模型进行识别;通过增加方面类别预测功能对语句包含的方面类别个数进行预测,降低在进行情感极性检测的时候出错的可能性。
技术领域
本发明属于自然语义处理中的情感分析领域,尤其涉及一种识别语句中方面类别和情感极性的方法和系统。
背景技术
随着电商的兴起和普及,人们越来越倾向网购,并且愿意在网络上分享自己的使用心得和商品评价,这些评价数据逐渐成为了能够决定人们购买决策的重要参考来源,同时商品厂家也会根据这些评价和建议不断改进自己的产品和服务质量,希望能够在激烈的市场竞争中取得领先地位。然而,随着产品评论的爆发式增长,用户很难充分使用这些海量信息。因此,面向方面的情感分析(ABSA)应运而生,该任务包括两个方面,第一识别出评论句子的方面类别,我们称作ACD任务;第二对识别出的方面类别进行情感极性分类,称为SA任务。
现有的面向方面的情感分析方法中,仅将评论语句视为一个方面类别然后进行情感极性识别。例如对于“这个手机屏幕不错”的评价,由于只有一个方面类别“手机屏幕”,现有的方法能够正确识别出该评价的情感极性为“正面”。然而对于多个方面类别的评论如“这个手机屏幕不错,但电池不耐用”,现有的方法就容易出现情感极性识别错误。
发明内容
有鉴于此,本发明提供一种语句中方面类别及情感极性联合识别的方法及系统,通过增加方面类别预测功能对语句包含的方面类别个数进行预测,降低在进行情感极性检测的时候出错的可能性。
为解决以上技术问题,本发明的技术方案为采用一种语句中方面类别及情感极性联合识别的方法,包括:
获取训练语句的双向隐状态;
获取预测的方面类别在当前时间步的隐状态,每个时间步仅输出一个方面类别;
把训练语句的双向隐状态转换成训练语句方面类别数量的高阶表示向量,并通过训练语句的高阶表示向量预测训练语句仅包含一个方面类别的概率;
将方面类别数量的高阶表示向量、当前时间步的隐状态、之前所有时间步隐状态的平均值进行聚合获得聚合值,利用聚合值以及方面类别数量的高阶表示向量获得训练语句的若干混合特征;利用混合特征预测训练语句当前步长的方面类别以及方面类别的情感极性。
作为一种改进,所述获取训练语句的双向隐藏状态的方法为:
从正反两个方向读取训练语句的文本序列,获取训练语句中每个单词正反两个方向的隐状态;
将每个单词正反两个方向的隐状态分别进行拼接获得每个单词的双向隐状态;
将训练语句中所有单词的双向隐状态进行拼接从而获得整个训练语句的双向隐状态。
作为一种改进,通过门控循环单元利用预测的前一个时间步的方面类别获取当前步长方面类别的隐状态。
作为一种改进,利用函数
计算预测训练语句仅包含一个方面类别的概率,其中为概率,v为高阶表示向量,Wv为概率预测权重矩阵,b为偏置,/为sigmod函数。
作为一种改进,利用全连接层I
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都晓多科技有限公司,未经成都晓多科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211258785.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式网络对抗攻击自训练学习方法
- 下一篇:一种丝杆跳动数据自动集成工装