[发明专利]文本情绪识别方法、装置及电子设备有效
申请号: | 201810621298.6 | 申请日: | 2018-06-15 |
公开(公告)号: | CN110609996B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 张春嫡 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F16/33 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情绪 识别 方法 装置 电子设备 | ||
1.一种文本情绪识别方法,包括:
获取语料;
通过依存句法提取所述语料中的情感词以及与情感词具有指定依存关系的关系词;
根据预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值,
其中,所述方法还包括:
生成所述语料对应的词项-文档矩阵;
以所述词项-文档矩阵中的文档向量与不同应用场景下的文档向量进行相似度匹配,确定所述语料所属的应用场景;
所述根据预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值包括:
根据所述语料所属的应用场景下的预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值;
其中,不同应用场景下的所述预置的情感词的情绪值以及各类型的关系词的关系权重不完全相同。
2.根据权利要求1所述的方法,其中,所述与情感词具有指定依存关系的关系词包括:与情感词具有指定依存关系的连词和/或副词。
3.根据权利要求1或2所述的方法,其中,所述根据预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值包括:
计算情感词的情绪值和与情感词具有所述指定依存关系的关系词的关系权重的累积值;
将所述语料中包含的所有情感词对应的所述累积值的和值作为所述语料的情绪值。
4.根据权利要求1所述的方法,其中,所述以所述词项-文档矩阵中的文档向量与不同应用场景下的文档向量进行相似度匹配,确定所述语料所属的应用场景包括:
对所述词项-文档矩阵采用奇异值分解算法进行降维处理;
以所述降维后的词项-文档矩阵中的文档向量与不同应用场景下的文档向量进行相似度匹配,确定所述语料所属的应用场景。
5.根据权利要求1所述的方法,其中,所述方法还包括:
确定所述语料的情绪值所属的情绪值范围,将所述情绪值范围所对应的情绪标签作为所述语料的出处对象的情绪特征。
6.一种文本情绪识别装置,包括:
数据获取模块,用于获取语料;
数据提取模块,用于通过依存句法提取所述语料中的情感词以及与情感词具有指定依存关系的关系词;
情绪计算模块,用于根据预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值,
其中,所述装置还包括:
矩阵生成模块,用于生成所述语料对应的词项-文档矩阵;
场景匹配模块,用于以所述词项-文档矩阵中的文档向量与不同应用场景下的文档向量进行相似度匹配,确定所述语料所属的应用场景;
所述情绪计算模块具体还用于,根据所述语料所属的应用场景下的预置的情感词的情绪值以及各类型的关系词的关系权重对所述语料进行情绪计算,得到所述语料的情绪值;
其中,不同应用场景下的所述预置的情感词的情绪值以及各类型的关系词的关系权重不完全相同。
7.根据权利要求6所述的装置,其中,所述与情感词具有指定依存关系的关系词包括:与情感词具有指定依存关系的连词和/或副词。
8.根据权利要求6或7所述的装置,其中,所述情绪计算模块包括:
情绪值计算单元,用于计算情感词的情绪值和与情感词具有所述指定依存关系的关系词的关系权重的累积值;
情绪值确定单元,用于将所述语料中包含的所有情感词对应的所述累积值的和值作为所述语料的情绪值。
9.根据权利要求6所述的装置,其中,所述场景匹配模块包括:
矩阵降维单元,用于对所述词项-文档矩阵采用奇异值分解算法进行降维处理;
场景匹配单元,用于以所述降维后的词项-文档矩阵中的文档向量与不同应用场景下的文档向量进行相似度匹配,确定所述语料所属的应用场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810621298.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:构建藏语问答语料库的方法及装置
- 下一篇:生成文本的摘要的方法和装置