[发明专利]一种识别对话情感原因的方法及装置在审
申请号: | 202010040765.3 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111241847A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 蔡林;杨海军;徐倩;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/35;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 宋正伟 |
地址: | 518027 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 对话 情感 原因 方法 装置 | ||
本发明公开了一种识别对话情感原因的方法及装置,其中方法为:将对话中各句子进行分词,对分词后每个句子中各词语的词向量进行叠加,获得每个句子的句子向量;将所述对话中各句子的句子向量输入聚类模型,得到所述各句子对应的各句子集;针对每个句子集,至少根据所述句子集中各句子的词语的词频确定所述句子集的主题词;根据所述句子集的主题词与情感词库中各类情感词的语义相似度,确定出所述句子集的主题词在所述情感词库中存在映射的目标情感词;根据各句子集的目标情感词,确定所述对话的情感原因。
技术领域
本发明涉及金融科技(Fintech)领域和情感分析领域,尤其涉及一种识别对话情感原因的方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求,情感识别与理解技术也是人机交互的基础性技术之一,目前在多种场景下,都有判断用户情感原因的需求。举例来说,用户进行投诉时,在电商平台上对用户产生情感的具体倾向(如产品问题)进行识别。
现有技术中一般采用词库匹配的方式对用户的情感原因进行识别,如根据与词库匹配到的“质量差”一词,定位用户的情感原因为产品质量问题。显然,这种单一匹配的判断方式不够准确,如将“质量差不多,但物流较慢”判断为质量问题。因此,现有技术不能准确判断用户的情感原因,是一个亟待解决的问题。
发明内容
本发明提供一种识别对话情感原因的方法及装置,解决了现有技术中不能准确判断用户的情感原因的问题。
第一方面,本发明实施例提供一种识别对话情感原因的方法,包括:将对话中各句子进行分词,对分词后每个句子中各词语的词向量进行叠加,获得每个句子的句子向量;将所述对话中各句子的句子向量输入聚类模型,得到所述各句子对应的各句子集;所述聚类模型是根据多个样本句子按照预设聚类算法训练获得的;针对每个句子集,至少根据所述句子集中各句子的词语的词频确定所述句子集的主题词;根据所述句子集的主题词与情感词库中各类情感词的语义相似度,确定出所述句子集的主题词在所述情感词库中存在映射的目标情感词;根据各句子集的目标情感词,确定所述对话的情感原因。
上述方法中,首先将对话中各句子进行分词将每个句子中各词语的词向量进行叠加,获得每个句子的句子向量,再将所述对话中各句子的句子向量输入聚类模型,得到所述各句子对应的各句子集,对所述对话做一个初步分类定位,再针对每个句子集,至少根据所述句子集中各句子的词语的词频确定所述句子集的主题词,进一步定位对话中每个句子的主题词,再根据所述句子集的主题词与情感词库中各类情感词的语义相似度,从而确定出目标情感词,该方法根据聚类模型、词频和语义相似度,逐步地缩小情感原因的范围,从而得到更准确的情感原因。
可选地,所述根据所述句子集中各句子的词语的词频确定所述句子集的主题词,包括:将所述句子集中的各句子输入文档主题生成模型,得到所述句子集的主题词;所述文档主题生成模型是通过多个样本句子中的词语的词频训练得到的。
上述方法中,通过将所述句子集中的各句子输入文档主题生成模型,得到所述句子集的主题词,文档主题生成模型可以找到词语与词语之间的潜在关系,从而提供了一种自动得到所述句子集的主题词的方法。
可选地,所述根据所述句子集中各句子的词语的词频确定所述句子集的主题词,包括:根据所述句子集中每个句子中各词语的词向量,确定所述句子集中各词语之间的语义相似度;确定所述句子集中的各相似词集;其中,每个相似词集中各词语的词向量之间的语义相似度均不小于第一语义相似度阈值;针对每个相似词集,将所述相似词集中平均语义相似度不小于第二语义相似度阈值的词语作为所述相似词集的原始词;其中,每个词语的平均语义相似度为所述词语与所述相似词集中其它各词语的语义相似度确定的;将各相似词集中词频之和不小于设定阈值的相似词集的原始词,作为所述句子集的主题词;所述相似词集的词频之和是为所述相似词集中各词语的词频之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010040765.3/2.html,转载请声明来源钻瓜专利网。