[发明专利]语义情绪识别方法、装置、设备及存储介质在审
申请号: | 202011596697.5 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112613324A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 张佳旭;孔庆超;王宇琪;蒋永余;柳力多;方省;盘浩军;罗引;王磊 | 申请(专利权)人: | 北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 蔡良伟;李曼 |
地址: | 100028 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 情绪 识别 方法 装置 设备 存储 介质 | ||
本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
技术领域
本申请涉及语义识别技术领域,尤其涉及一种语义情绪识别方法、装置、设备及存储介质。
背景技术
随着互联网的发展和社交网络、网购的流行,用户在各个网络平台上留下了大量的文本数据。其中很大一部分的文本具有主观性倾向,表达了用户对于特定实体、事件或者自身的情感。
目前,相关技术中为了识别语义的情绪,会从文本中提取词频-逆文本频率指数(term frequency–inverse document frequency,tf-idf)特征,然后使用机器学习分类器识别情绪类别,但是文本中的词语并非词汇的堆砌,不同的句法会出现完全不同的情绪表达,而相关技术中利用简单的统计特征进行情绪分类并不能区别不同的句法,这也会导致最终识别情绪的效果并不理想,准确率较低。
发明内容
为克服相关技术中存在的利用简单的统计特征进行情绪分类无法区别不同句法,从而导致识别情绪准确率低的问题,本申请提供一种语义情绪识别方法、装置、设备及存储介质。
根据本申请的第一方面,提供一种语义情绪识别方法,包括:
获取待识别文本;
对所述待识别文本的全局语义信息进行提取,得到第一语义向量;
利用预训练的词向量模型确定所述待识别文本的词向量矩阵;
根据所述词向量矩阵确定第二语义向量;
根据所述词向量矩阵计算所述待识别文本中的每个词的词向量与预设情绪词语的词向量的相似度,将计算得到的所有相似度确定为第三语义向量;
根据所述第一语义向量、所述第二语义向量和所述第三语义向量确定所述待识别文本所属的情绪类别。
在一个可选的实施例中,所述对所述待识别文本的全局语义信息进行提取,得到第一语义向量,包括:
在所述待识别文本中添加预设符号;
将添加有预设符号的待识别文本的全局语义信息转换为文本向量;
根据所述预设符号在所述待识别文本中的位置得到所述预设符号的位置向量;
将所述文本向量、所述位置向量和预设的所述预设符号的词向量进行融合,得到第一语义向量。
在一个可选的实施例中,所述利用预训练的词向量模型确定所述待识别文本的词向量矩阵,包括:
利用预设分词方法对所述待识别文本进行分词,得到所述待识别文本的至少一个词;
通过预训练的词向量模型确定各所述词的词向量;
根据各所述词的词向量得到所述待识别文本的词向量矩阵。
在一个可选的实施例中,所述根据所述词向量矩阵确定第二语义向量,包括:
将所述词向量矩阵输入到预训练的第一模型中,利用不同尺寸的卷积核根据相邻词向量的关联性提取词组语义特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司,未经北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011596697.5/2.html,转载请声明来源钻瓜专利网。