[发明专利]基于情感分析的文本语句处理方法、装置以及设备有效
申请号: | 202210595568.7 | 申请日: | 2022-05-30 |
公开(公告)号: | CN114676695B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 熊浩良;薛云;燕泽昊;庞士冠;卢国钧 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216;G06F40/30;G06F16/35 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 叶琼园 |
地址: | 510006 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 情感 分析 文本 语句 处理 方法 装置 以及 设备 | ||
1.一种基于情感分析的文本语句处理方法,其特征在于,包括以下步骤:
获取样本语句以及与所述样本语句的相关联的若干组四元组标签信息;
获取样本语句的初始句子序列,根据所述样本语句的初始句子序列以及四元组标签信息,构建所述样本语句的四元组标签序列;
将所述样本语句的初始句子序列以及四元组标签序列输入至预设的词嵌入模型,获取所述词嵌入模型输出的第一损失值;
基于所述样本语句的四元组标签序列,构建与所述样本语句对应的若干组正例查询语句序列以及对应的若干组负例查询语句序列;
将所述若干组正例查询语句序列划分为若干个类型对应的样本正例查询语句序列,获取所述若干组正例查询语句序列对应的样本查询语句序列,根据所述样本正例查询语句序列,获取所述词嵌入模型输出的第二损失值;
将所述样本语句对应的正例查询语句序列以及负例查询语句序列进行拼接,获取若干组四元组表示,获取标签训练集,所述标签训练集包括所述若干组四元组表示对应的真实标签值,将所述若干组四元组表示以及标签训练集输入至预设的全连接网络中,获取所述全连接网络输出的第三损失值;
根据所述第一损失值、第二损失值以及第三损失值,构建所述词嵌入模型的损失函数,重复将所述样本语句的初始句子序列以及四元组标签序列输入至所述词嵌入模型的词嵌入模型中,进行迭代训练,直到满足训练停止条件,获取训练好的词嵌入模型;
获取待测样本语句,将所述待测样本语句输入至所述训练好的词嵌入模型,获取所述训练好的词嵌入模型输出的所述待测样本语句的情感分析结果。
2.根据权利要求1所述的基于情感分析的文本语句处理方法,其特征在于:所述样本语句包括若干个单词,所述单词包括方面词以及观点词,所述四元组标签信息包括与所述样本语句相关联的特定词以及标记词,所述特定词包括特定方面词以及特定观点词,标记词包括方面词种类以及情感极性。
3.根据权利要求2所述的基于情感分析的文本语句处理方法,其特征在于,所述根据所述样本语句的初始句子序列以及四元组标签信息,构建所述样本语句的四元组标签序列,包括步骤:
对于每一组四元组标签信息,根据所述特定词在所述样本语句的初始句子序列上的位置索引,获取特定词索引向量,其中,所述特定词索引信息包括方面词索引向量以及观点词索引向量;
根据所述标记词在预设的映射表上的相应列表的索引,获取标记词索引向量,其中,所述标记词索引向量包括方面词种类索引向量以及情感极性索引向量;
将所述特定词索引向量以及标记词索引向量进行组合,获取各组四元组标签信息对应的四元组标签表示,将所述各组四元组标签表示进行组合,构建所述样本语句的四元组标签序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210595568.7/1.html,转载请声明来源钻瓜专利网。