[发明专利]一种文本情感分析方法和装置有效
申请号: | 202211718347.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115659995B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 许辉鹏 | 申请(专利权)人: | 荣耀终端有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 情感 分析 方法 装置 | ||
1.一种文本情感分析方法,其特征在于,包括:
获取评论信息和所述评论信息对应的来源信息;
将所述评论信息和所述评论信息对应的来源信息输入情感分析模型,得到所述情感分析模型输出的所述评论信息的情感分析结果;
其中,所述情感分析模型是通过训练数据集对预设模型训练得到的模型,所述训练数据集中包括多条样本评论信息以及每条样本评论信息对应的来源信息,所述预设模型包括BERT层、专家神经网络层、分类器层和归一化指数函数softmax层;
所述将所述评论信息和所述评论信息对应的来源信息输入情感分析模型,得到所述情感分析模型输出的所述评论信息的情感分析结果包括:
将所述评论信息输入所述BERT层,得到所述BERT层输出的第一文本向量;
将所述来源信息输入所述BERT层,得到所述BERT层输出的所述来源信息的嵌入向量;
所述来源信息的嵌入向量满足如下公式:其中,表示所述来源信息的嵌入向量,表示所述来源信息包括的每个文本字符对应的嵌入向量,count(source)表示所述来源信息对应的文本字符的数目;
将所述第一文本向量和所述来源信息的嵌入向量输入所述专家神经网络层,得到所述专家神经网络层输出的第二文本向量;
将所述第二文本向量输入所述分类器层,得到所述分类器层输出的所述评论信息对应的多个逻辑值,每个逻辑值指示所述评论信息对应的一种情感倾向的分数;
将所述多个逻辑值输入所述softmax层,得到所述softmax层输出的至少一个情感倾向的概率;
根据所述至少一个情感倾向的概率确定所述评论信息的情感分析结果,所述评论信息的情感分析结果是所述至少一个情感倾向的概率中概率最大的情感倾向。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本向量输入所述专家神经网络层,得到所述专家神经网络层输出的第二文本向量包括:
将所述第一文本向量分别输入所述专家神经网络层包括的多个专家神经网络,得到所述多个专家神经网络中每个专家神经网络分别输出的第三文本向量;
根据所述来源信息的嵌入向量和所述多个专家神经网络中每个专家神经网络分别输出的第三文本向量计算所述每个专家神经网络的路由权重;
根据所述每个专家神经网络的路由权重对所述每个专家神经网络输出的第三文本向量进行加权平均得到所述第二文本向量。
3.根据权利要求1或2所述的方法,其特征在于,所述每个专家神经网络的路由权重和所述第二文本向量满足如下公式:其中,表示第i个专家神经网络的路由权重,表示所述第二文本向量,表示所述来源信息的嵌入向量,m表示所述评论信息为第m个待处理评论信息,K表示专家神经网络的个数,Ei表示第i个专家神经网络输出的第三文本向量。
4.根据权利要求1或2所述的方法,其特征在于,所述分类器层包括多个分类器,所述多个分类器中的每个分类器用于处理一种来源信息对应的评论信息;
所述将所述第二文本向量输入所述分类器层,得到所述分类器层输出的所述评论信息对应的多个逻辑值包括;
将所述第二文本向量输入所述多个分类器中的第一分类器,得到所述第一分类器输出的所述评论信息对应的逻辑值,所述第一分类器对应所述评论信息对应的所述来源信息。
5.根据权利要求1或2所述的方法,其特征在于,所述softmax层输出的至少一个情感倾向的概率满足如下公式: 其中,表示所述softmax层输出的概率,k表示选定的逻辑值的个数,选定的逻辑值的概率大于或等于预设阈值,S表示前k个逻辑值的集合,c为常量,C表示分类的类别数,j∈S,zi表示第i个逻辑值,zj表示第j个逻辑值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211718347.0/1.html,转载请声明来源钻瓜专利网。