[发明专利]基于标签描述生成的评论文本情感分类方法有效
申请号: | 202111123240.7 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113806545B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 朱小飞;彭展望 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 黄河 |
地址: | 400054 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标签 描述 生成 评论 文本 情感 分类 方法 | ||
1.基于标签描述生成的评论文本情感分类方法,其特征在于,包括以下步骤:
S1:为各个情感标签生成对应的具有相关性和区分力的标签描述;
S2:将各个情感标签及其标签描述映射到预先建立的情感分类模型中;
S3:将待分类评论文本输入到所述情感分类模型中,由所述情感分类模型输出对应的预测情感标签;
S4:将待分类评论文本的预测情感标签作为其情感分类的结果;
其中,步骤S1中,通过如下步骤生成情感标签的标签描述:
S101:构建包含若干个评论文本d的语料库D,以及情感标签集C={1,2,…,c};
S102:基于所有情感标签为c的评论文本d计算单词w与情感标签c的相关性得分;
S103:基于所有情感标签为c的评论文本d计算单词w与情感标签c的逆标签频次;
S104:计算单词w相对于情感标签c基于逆标签频次的描述相关性分数;
S105:为情感标签c选取描述相关性分数最高的K个单词[w1,c,…,wi,c,…,wk,c]作为对应的标签描述;
通过如下公式计算相关性得分:
通过如下公式计算逆标签频次:
通过如下公式计算描述相关性分数:
得到K个单词[w1,c,…,wi,c,…,wk,c]后,使用查找表将作为标签描述的单词wi,c嵌入为de维词向量qi,c,再通过公式计算得到标签描述qc:
上述式中:rw,c表示相关性得分;Dc表示语料库D中所有情感标签为c的评论文本;fw,d表示单词w在评论文本d中出现的次数;fw,D表示语料库D中包含单词w的评论文本数量;ILF表示逆标签频次;LF表示标签频次;yd表示评论文本d对应的情感标签;表示描述相关性分数;
2.如权利要求1所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S3中,所述情感分类模型通过如下步骤得到预测情感标签:
S301:对待分类评论文本进行编码,以得到对应的评论上下文表示;
S302:通过自注意力机制提取评论上下文表示对应的自注意力文本表示;
S303:通过标签注意力机制提取评论上下文表示对应的标签注意力文本表示;
S304:通过自适应门控机制融合所述自注意力文本表示和所述标签注意力文本表示,以生成对应的文本最终表示;
S305:基于所述文本最终表示计算评论上下文表示在情感标签上的分布概率,并将分布概率最高的情感标签作为对应待分类评论文本的预测情感标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111123240.7/1.html,转载请声明来源钻瓜专利网。