[发明专利]一种文本情感分析方法和装置有效
申请号: | 202211718347.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115659995B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 许辉鹏 | 申请(专利权)人: | 荣耀终端有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 情感 分析 方法 装置 | ||
本申请实施例提供一种文本情感分析方法和装置,涉及机器学习算法领域,能够提高情感类型分析结果的准确度。其方法为:获取评论信息和评论信息对应的来源信息;将评论信息和评论信息对应的来源信息输入情感分析模型,得到情感分析模型输出的评论信息的情感分析结果;其中,情感分析模型是通过训练数据集对预设模型训练得到的模型,训练数据集中包括多条样本评论信息以及每条样本评论信息对应的来源信息,预设模型包括BERT层、专家神经网络层、分类器层和归一化指数函数softmax层。
技术领域
本申请涉及机器学习算法领域,尤其涉及一种文本情感分析方法和装置。
背景技术
目前,企业为了更好地改进产品、改善服务质量,可以对海量的互联网舆情数据(用户在互联网上的评论)的情感倾向进行判断,借助消费者评论了解产品优势和不足,以指导企业改进产品、改善服务质量。
相关技术中,可以采用基于长短期记忆网络加注意力机制的方法对用户的评论进行处理,得到文本序列构建的基于自注意力机制的模型,将待分析的用户的评论导入该模型中,可以完成目标文本的情感趋势分析。然而,该方法需要大量监督数据,在监督数据的数据量较小的情况下情感类型分析结果的准确度不高。
发明内容
本申请实施例提供一种文本情感分析方法和装置,能够提高情感类型分析结果的准确度。
第一方面,本申请实施例提供一种文本情感分析方法,包括:获取评论信息和评论信息对应的来源信息;将评论信息和评论信息对应的来源信息输入情感分析模型,得到情感分析模型输出的评论信息的情感分析结果;其中,情感分析模型是通过训练数据集对预设模型训练得到的模型,训练数据集中包括多条样本评论信息以及每条样本评论信息对应的来源信息,预设模型包括BERT层、专家神经网络层、分类器层和归一化指数函数softmax层。
本申请实施例提供的文本情感分析方法,在通过情感分析模型对评论信息进行情感分析时,特别考虑到了评论信息的来源信息,可以使得评论信息的情感分析结果更加准确。其中,情感分析模型可以包括BERT层、专家神经网络层、分类器层和softmax层,相比现有技术仅通过一种类型的简单模型对评论信息进行情感分析,本申请提供的情感分析模型可以有效提高情感分析的准确率(例如可以提升15%左右),为业务提供了更准确实时的情感分析能力。通过实时准确分析评论信息的情感倾向,可以提高差评舆情的召回能力,提高召回问题进工单的效率,进而提高业务干预差评问题的效率,避免公司(企业)形象受损、客户流失、销量下滑等问题。
在一种可能的实现方式中,将评论信息和评论信息对应的来源信息输入情感分析模型,得到情感分析模型输出的评论信息的情感分析结果包括:将评论信息输入BERT层,得到BERT层输出的第一文本向量;将来源信息输入BERT层,得到BERT层输出的来源信息的嵌入向量;将第一文本向量和来源信息的嵌入向量输入专家神经网络层,得到专家神经网络层输出的第二文本向量;将第二文本向量输入分类器层,得到分类器层输出的评论信息对应的多个逻辑值,每个逻辑值指示评论信息对应的一种情感倾向的分数;将多个逻辑值输入softmax层,得到softmax层输出的至少一个情感倾向的概率;根据至少一个情感倾向的概率确定评论信息的情感分析结果,评论信息的情感分析结果是至少一个情感倾向的概率中概率最大的情感倾向。
其中,专家神经网络层可以利用不同来源的评论信息对应的文本字符之间的联系促进情感分析模型的学习,以提高情感分析准确度。分类器层可以保持不同来源的评论信息之间的特征独立,可以使得对不同来源的评论信息的情感分析更加准确。
在一种可能的实现方式中,将第一文本向量输入专家神经网络层,得到专家神经网络层输出的第二文本向量包括:将第一文本向量分别输入专家神经网络层包括的多个专家神经网络,得到多个专家神经网络中每个专家神经网络分别输出的第三文本向量;根据来源信息的嵌入向量和多个专家神经网络中每个专家神经网络分别输出的第三文本向量计算每个专家神经网络的路由权重;根据每个专家神经网络的路由权重对每个专家神经网络输出的第三文本向量进行加权平均得到第二文本向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211718347.0/2.html,转载请声明来源钻瓜专利网。