[发明专利]一种文本情绪分析方法、装置及设备在审
申请号: | 201910554005.1 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110276076A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 单斌 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情绪 分类模型 分类网络 情绪分析 文本向量 装置及设备 特征提取 语义特征 细粒度 向量 文本训练 文本转换 样本训练 语义内容 输出 网络 应用 分析 | ||
1.一种文本情绪分析方法,其特征在于,包括:
基于词向量模型,将所述待处理文本映射为文本向量;
基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别,包括:
基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;
选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。
3.根据权利要求1所述的方法,其特征在于,训练所述文本情绪分类模型的过程,包括:
获取标注有预设情绪类别的文本训练样本;
基于词向量模型将所述文本训练样本转换为对应的文本训练样本向量;
基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从所述文本训练样本向量中提取得到语义特征向量;
基于所述预设文本情绪分类模型中的分类网络,对所述文本训练样本向量的语义特征向量进行分析得到所述文本训练样本所属情绪类别的分类结果;
基于所述文本训练样本的分类结果和标注类别,调整所述预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析所述文本训练样本得到的分类结果满足预设收敛条件,得到所述文本情绪分类模型。
4.根据权利要求3所述的方法,其特征在于,所述获取已标注情绪类别的文本训练样本,包括:
获取预标注数据,所述预标注数据中包含表征文本情绪的情绪标识;
利用所述预标注数据训练预设文本情绪分类模型得到基础分类模型;
基于所述基础分类模型获得各个候选文本训练样本所属情绪类别的置信度;
依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本。
5.根据权利要求4所述的方法,其特征在于,所述依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本,包括:
选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。
6.一种文本情绪分析装置,其特征在于,包括:
向量转换模块,用于基于词向量模型,将所述待处理文本映射为文本向量;
特征提取模块,用于基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
分类模块,用于基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
7.根据权利要求6所述的装置,其特征在于,所述分类模块包括:
置信度获取子模块,用于基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;
选取子模块,用于选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910554005.1/1.html,转载请声明来源钻瓜专利网。